Está a ser desenvolvido um sistema com base em dados recolhidos a partir de documentos históricos do Arquivo Nacional da Torre do Tombo.
António Anjos, professor no Departamento de Informática da Universidade de Évora (UÉ) e investigador no NOVA LINCS, está a usar inteligência artificial para transcrever documentos históricos escritos à mão.
Há muitos documentos históricos que contêm informação que é muito interessante, por exemplo, para historiadores e para investigadores. No entanto, essa documentação não está transcrita, porque requer muito tempo e é muito difícil.
Os sistemas atuais de reconhecimento ótico de caracteres (OCR, sigla em inglês) foram na sua maioria desenvolvidos para transcrever documentos feitos por máquinas, pois nestas situações os caracteres são todos uniformes, um A é sempre um A, o que o torna mais fácil de transcrever.
No entanto, para documentos escritos à mão isto é mais complicado, especialmente quando estamos a falar de documentos históricos.
Como já passaram muitos anos, a tinta começa a desaparecer e o próprio papel pode estar danificado. Para além disso, alguns documentos têm vários autores, cada um com a sua própria caligrafia o que torna mais difícil o processo de transcrição automática.
Para resolver isto, a equipa de António Anjos está a curar um dataset criado a partir de imagens recolhidos no Arquivo Nacional da Torre do Tombo.
Estas imagens vão ser usadas para treinar modelos de redes neuronais de aprendizagem profunda para tentar resolver esta situação e permitir uma transcrição automática destes manuscritos.
“Esperamos que isto vá resolver, ou pelo menos contribuir para resolver, este problema complexo”, reforça.
Saiba mais sobre o investigador em: Linkedin | Researchgate | Google Scholar | UÉ