sexta-feira, 14 de maio de 2021

OCR - digitalizando textos antigos e não só

 O OCR (Optical Character Recognition) é uma forma de digitalizar um texto. Geralmente faz-se com textos antigos ou que, tendo sido publicados antes do computador, queremos guardar. O OCR também é usado para reedições, quando o original foi publicado noutra editora. 

Um dos problemas é que o sistema tende a confundir algumas letras: o l e o 1, o r e o v, o m e o n...

Uma leitura humana é sempre recomendável, tal como com as traduções google. 


Sem comentários:

Enviar um comentário

Guia de sinais de revisão

Mesmo com o semestre já findado, deixo aqui  este guia bastante completo dos sinais usados na revisão de texto. O  site  Revisão para quê t...