Revolution i handstilsigenkänning: Nya möjligheter för forskning!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof. Dr. Rehbein och Dr. Werth från University of Passau startar ett forskningsprojekt om automatisk handskriftsigenkänning (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof. Dr. Rehbein och Dr. Werth från University of Passau startar ett forskningsprojekt om automatisk handskriftsigenkänning (2025-2027).

Revolution i handstilsigenkänning: Nya möjligheter för forskning!

Forskare vid University of Passau har lanserat ett innovativt projekt om felmetodik vid automatisk handskriftsigenkänning. Professorerna Malte Rehbein och Alexander Werth leder projektet, som är en del av Volkswagen Foundations finansieringslinje "Awakening". Projektets varaktighet sträcker sig från 2025 till 2027 och kallas "Methodology of the Inaccurate".

Det centrala målet med detta projekt är att undersöka i vilken utsträckning felaktig data kan möjliggöra vetenskapligt arbete. Automatiskt transkriberade historiska manuskript från rådsprotokoll från 1600- till 1800-talen används, som har en noggrannhet på runt 90 %. Projektet kommer att jämföra dessa transkriptioner med manuellt transkriberade data, vilket uppnår 100 % noggrannhet.

Science Center "Metodikum"

Projektet är en del av vetenskapscentret "Mehodikum", som grundades av lärosäten för flerspråkig beräkningslingvistik, beräkningshumaniora och tysk lingvistik. Syftet med ”Metodikum” är grundläggande metodologisk forskning inom humaniora samt stöd till datorstödda och digitala metoder.

Relevansen av automatisk handskriftsigenkänning understryks också av de utmaningar som maskiner står inför. Människor kan dechiffrera handstil, medan denna förmåga är mycket mer komplex för maskiner. Tobias Hodel från Zürichs statsarkiv rapporterar om framstegen inom automatiserad handskriftsigenkänning i projekt som READ, som finansieras av EU-kommissionen och syftar till att transkribera stora mängder handskrivna dokument.

Tekniskt stöd och utvecklingsnivå

Ett centralt verktyg i detta sammanhang är den kostnadsfria programvaran Transkribus, som inte bara möjliggör automatisk igenkänning och transkription, utan även sökning av historiska dokument. Denna programvara har etablerat sig som ett värdefullt verktyg för arkiv, bibliotek och dokumentationsinstitutioner.

Att använda Transkribus kräver att utbildningsdata skapas genom manuell transkription, vilket är tidskrävande men kan avsevärt förbättra kvaliteten på igenkänningen. Aktuella resultat visar att vissa modeller av programvaran kan uppnå en Character Error Rate (CER) på mindre än 1 %, vilket representerar en anmärkningsvärd noggrannhet för specifika textkorpus. Transkribus erbjuder även olika verktyg för att skapa egna modeller, anpassade efter användarens respektive behov.

I takt med att tekniken har utvecklats har det skett betydande förbättringar i handskriftsigenkänningen de senaste åren. Kvaliteten på de automatiska transkriptionerna beror i första hand på typsnittet som används och antalet händer som används. Trots dessa framsteg kvarstår utmaningen att maskiner för närvarande inte kan uppnå en felfrekvens på 0 %, med acceptabla nivåer för mänskliga transkriptioner under 10 %.

Sammantaget visar utvecklingen inom automatiserad handskriftsigenkänning hur kombinationen av mänsklig och maskinell intelligens kan berika vetenskapligt arbete och avsevärt främja digitaliseringen av historiska innehav. Den ökande effektiviteten av transkription, med stöd av HTR-teknologi, öppnar nya möjligheter för historisk forskning och utveckling av värdefull information från arkivmaterial. Samarbete mellan forskare och modern teknik har potential att revolutionera forskningen inom humaniora.

För ytterligare information och insikter i de tekniska aspekterna av handskriftsigenkänning, se projektsidorna Universitetet i Passau, DHC och Bop rekommenderad.