Revolução no reconhecimento de caligrafia: Novas oportunidades para pesquisa!
Werth da Universidade de Passau estão iniciando um projeto de pesquisa sobre reconhecimento automático de caligrafia (2025-2027).

Revolução no reconhecimento de caligrafia: Novas oportunidades para pesquisa!
Pesquisadores da Universidade de Passau lançaram um projeto inovador sobre metodologia de erro no reconhecimento automático de escrita. Os professores Malte Rehbein e Alexander Werth lideram o projeto, que faz parte da linha de financiamento “Awakening” da Fundação Volkswagen. A duração do projeto se estende de 2025 a 2027 e é chamada de “Metodologia do Impreciso”.
O objetivo central deste projeto é investigar até que ponto dados incorretos podem viabilizar o trabalho científico. São utilizados manuscritos históricos transcritos automaticamente de atas conciliares dos séculos XVII a XIX, que apresentam uma precisão de cerca de 90%. O projeto irá comparar essas transcrições com dados transcritos manualmente, alcançando 100% de precisão.
Centro de Ciências “Methodikum”
O projeto faz parte do centro de ciências “Methodikum”, que foi fundado por cátedras de linguística computacional multilíngue, humanidades computacionais e linguística alemã. O objetivo do “Methodikum” é a pesquisa metodológica básica na área de humanidades, bem como o apoio a métodos digitais e auxiliados por computador.
A relevância do reconhecimento automático de escrita também é sublinhada pelos desafios enfrentados pelas máquinas. Os humanos são capazes de decifrar a caligrafia, enquanto essa habilidade é muito mais complexa para as máquinas. Tobias Hodel, dos Arquivos do Estado de Zurique, relata o progresso no reconhecimento automatizado de escrita manual em projetos como o READ, que é financiado pela Comissão Europeia e visa transcrever grandes quantidades de documentos manuscritos.
Suporte tecnológico e nível de desenvolvimento
Uma ferramenta central neste contexto é o software gratuito Transkribus, que permite não só o reconhecimento e a transcrição automáticos, mas também a pesquisa de documentos históricos. Este software se consolidou como uma ferramenta valiosa para arquivos, bibliotecas e instituições de documentação.
O uso do Transkribus requer a criação de dados de treinamento por meio de transcrição manual, o que consome tempo, mas pode melhorar significativamente a qualidade do reconhecimento. Os resultados atuais mostram que alguns modelos do software podem atingir uma taxa de erro de caracteres (CER) inferior a 1%, o que representa uma precisão notável para corpora de texto específicos. Transkribus também oferece diversas ferramentas para a criação de seus próprios modelos, adaptados às respectivas necessidades do usuário.
À medida que a tecnologia avançou, houve melhorias significativas no reconhecimento de escrita manual nos últimos anos. A qualidade das transcrições automáticas depende principalmente da fonte utilizada e do número de mãos utilizadas. Apesar destes avanços, permanece o desafio de que as máquinas são atualmente incapazes de atingir uma taxa de erro de 0%, com níveis aceitáveis para transcrições humanas abaixo de 10%.
No geral, o desenvolvimento do reconhecimento automatizado de escrita manual mostra como a combinação da inteligência humana e da máquina pode enriquecer o trabalho científico e avançar significativamente a digitalização de acervos históricos. A crescente eficiência da transcrição, apoiada pela tecnologia HTR, abre novas oportunidades para a investigação histórica e o desenvolvimento de informações valiosas a partir de materiais de arquivo. A colaboração entre cientistas e tecnologias modernas tem o potencial de revolucionar a investigação nas ciências humanas.
Para mais informações e insights sobre os aspectos técnicos do reconhecimento de escrita manual, consulte as páginas do projeto Universidade de Passau, DHC e Bop recomendado.