Como converter documentos digitalizados para Word - The Happy Android

Se precisar digitalizar um livro em formato de texto, você pode ter várias perguntas. Pode ser feito? Que tal a qualidade, é bom? Não apenas isso pode ser feito, mas também existem várias maneiras de converter um documento digitalizado para o Word. Vamos ver:

  • Digitalizar o documento em formato PDF e editá-lo posteriormente com Adobe Acrobat XI Pro para salvá-lo no formato Word. A versão Pro do Acrobat é paga, mas você pode comprar uma licença de avaliação gratuita de 30 dias.
  • Do site OnlineOCR.net. Este aplicativo da web permite converter documentos nos formatos PDF, JPG, TIFF e GIF para Word, Excel e texto. Na versão gratuita, podemos converter até 15 páginas por hora e documentos de no máximo uma página.
  • Digitalizando o documento no formato (OCR) e salvá-lo como texto. Então, podemos abrir o Word e editar ou salvá-lo no formato .doc.
  • Usando algum programa de reconhecimento óptico de caracteres:
    •  VueScan (disponível para Windows, Mac OS X e Linux)
    • Kooka(para Linux)
    • Lente de escritório (para Android e ios)
    • CamScanner (para Android e ios)

A forma mais eficiente de todas que poderíamos dizer é através do Adobe Acrobat Pro, mas somente se a digitalização for muito, muito limpa e de alta qualidade. Os aplicativos de reconhecimento óptico de caracteres evoluíram muito, mas ainda mostram algumas lacunas com coisas como negrito ou itálico, e a transcrição de algumas palavras dependendo do tipo de fonte do documento original pode estar errada.

Tente digitalizar e passar este documento para o Word para ver o que acontece

Do próprio scanner

Alguns scanners incluem o recurso Optical Recognition (OCR) em seu próprio programa de digitalização. Para digitalizar um documento em texto, basta definir o formato de digitalização e olhar para aquele que se refere a OCR ou similar (depende da marca / modelo do scanner).

Vá de PDF para Word com Adobe Acrobat XI Pro

Uma vez Adobe Acrobat XI Pro (AQUI você tem uma versão de avaliação gratuita de 30 dias) vá para “Ferramentas -> Reconhecimento de texto -> Neste arquivo”.

Na janela de "Reconhecer texto"Clique em"Editar”E escolha o idioma do texto, estilo de saída e resolução.

Para terminar, volte para “Ferramentas -> Edição de conteúdo -> Editar texto e imagens”E modifique o texto se precisar corrigir uma palavra. Para finalizar, clique em "Arquivo -> Salvar como”E salve em formato Word.

OnlineOCR

OnlineOCR é uma aplicação web para transferir imagens ou pdfs para o Word e é muito fácil de utilizar. Eu explico como funciona: Digite //www.onlineocr.net/ e clique em "Selecione o arquivo”. Selecione o documento digitalizado e, em seguida, escolha o idioma e o formato de saída nos 2 menus suspensos que você tem no centro da tela.

Para finalizar clique em "Converter”. Logo abaixo aparecerá uma visualização de texto simples que você pode editar se precisar corrigir alguma palavra. Por fim, clique em "Baixar arquivo de saída”E você pode baixar o arquivo no formato Word. Aqui está um exemplo de um PDF convertido para Word com OnlineOCR:

  • PDF original:

  • Documento convertido:

Se este aplicativo da web não satisfaz você, você pode tentar outras alternativas semelhantes, como FreeOCR ou Free-Online-OCR.

Programas de reconhecimento óptico de caracteres (OCR)

Se você não deseja modificar seus documentos online e precisa de um aplicativo de desktop, pode usar aplicativos como VueScan (que também está disponível para Mac e Linux, além do onipresente Windows).

Outra possibilidade é usar seu dispositivo Android ou iOS para digitalizar o documento e convertê-lo em texto diretamente. Existem aplicativos como Lente de escritório (para Android e ios) ou CamScanner (para Android e ios) que realizam todo o processo a partir do mesmo aplicativo. Recomenda-se, nesses casos, limpar a imagem antes de convertê-la em texto. Se você quiser saber mais sobre este método, dê uma olhada em ESTA POSTAGEM.

Na minha opinião, a técnica de reconhecimento óptico de caracteres, embora tenha melhorado muito nos últimos anos, ainda está a anos-luz de ser uma técnica perfeita. Muitos detalhes, muitas palavras que "traduz" com letras erradas e símbolos que desarrumam o texto. Ele ainda não tem aquela inteligência extra que te faz ver que «t &! $ olog1a»Não pode ser uma tradução válida de qualquer palavra em um texto. Ainda não vejo uma compreensão de leitura, mas um simples reconhecimento visual de letras individuais que formam palavras sem integrá-las ao resto do texto. No entanto, estou convencido de que o momento em que daremos esse último grande salto está se aproximando a cada dia.

Você tem Telegrama instalado? Receba a melhor postagem de cada dia no nosso canal. Ou se preferir, descubra tudo no nosso página do Facebook.

Postagens recentes

$config[zx-auto] not found$config[zx-overlay] not found