Revolution inden for håndskriftsgenkendelse: Nye muligheder for forskning!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof. Dr. Rehbein og Dr. Werth fra University of Passau starter et forskningsprojekt om automatisk håndskriftsgenkendelse (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof. Dr. Rehbein og Dr. Werth fra University of Passau starter et forskningsprojekt om automatisk håndskriftsgenkendelse (2025-2027).

Revolution inden for håndskriftsgenkendelse: Nye muligheder for forskning!

Forskere ved University of Passau har lanceret et innovativt projekt om fejlmetodologi i automatisk håndskriftsgenkendelse. Professorerne Malte Rehbein og Alexander Werth leder projektet, som er en del af Volkswagen Foundations "Awakening"-finansieringslinje. Projektets varighed strækker sig fra 2025 til 2027 og kaldes "Methodology of the Unaccurate".

Det centrale mål med dette projekt er at undersøge, i hvilket omfang ukorrekte data kan muliggøre videnskabeligt arbejde. Der anvendes automatisk transskriberede historiske manuskripter fra rådsprotokoller fra det 17. til 19. århundrede, som har en nøjagtighed på omkring 90 %. Projektet vil sammenligne disse transskriptioner med manuelt transskriberede data og opnå 100 % nøjagtighed.

Videnskabscenter "Metodikum"

Projektet er en del af videnskabscentret “Metodikum”, som blev grundlagt af lærere for flersproget datalingvistik, datateknisk humaniora og tysk sprogvidenskab. Formålet med "Metodikum" er grundlæggende metodologisk forskning inden for humaniora samt understøttelse af computerstøttede og digitale metoder.

Relevansen af ​​automatisk håndskriftsgenkendelse understreges også af de udfordringer, som maskiner står over for. Mennesker er i stand til at tyde håndskrift, hvorimod denne evne er meget mere kompleks for maskiner. Tobias Hodel fra Zürichs statsarkiv rapporterer om fremskridtene inden for automatiseret håndskriftsgenkendelse i projekter som READ, som er finansieret af Europa-Kommissionen og har til formål at transskribere store mængder håndskrevne dokumenter.

Teknologisk support og udviklingsniveau

Et centralt værktøj i denne sammenhæng er den gratis Transkribus-software, som ikke kun muliggør automatisk genkendelse og transskription, men også søgning i historiske dokumenter. Denne software har etableret sig som et værdifuldt værktøj for arkiver, biblioteker og dokumentationsinstitutioner.

Brug af Transkribus kræver oprettelse af træningsdata gennem manuel transskription, hvilket er tidskrævende, men kan forbedre kvaliteten af ​​genkendelse betydeligt. Aktuelle resultater viser, at nogle modeller af softwaren kan opnå en Character Error Rate (CER) på mindre end 1 %, hvilket repræsenterer en bemærkelsesværdig nøjagtighed for specifikke tekstkorpora. Transkribus tilbyder også forskellige værktøjer til at skabe dine egne modeller, tilpasset brugerens respektive behov.

Efterhånden som teknologien har udviklet sig, er der sket betydelige forbedringer i håndskriftsgenkendelse i de seneste år. Kvaliteten af ​​de automatiske transskriptioner afhænger primært af den anvendte skrifttype og antallet af brugte hænder. På trods af disse fremskridt er udfordringen stadig, at maskiner i øjeblikket ikke er i stand til at opnå en fejlrate på 0 %, med acceptable niveauer for menneskelige transskriptioner på under 10 %.

Samlet set viser udviklingen inden for automatiseret håndskriftsgenkendelse, hvordan kombinationen af ​​menneskelig og maskinel intelligens kan berige videnskabeligt arbejde og markant fremme digitaliseringen af ​​historiske besiddelser. Den stigende effektivitet af transskription, understøttet af HTR-teknologi, åbner nye muligheder for historisk forskning og udvikling af værdifuld information fra arkivmaterialer. Samarbejde mellem forskere og moderne teknologier har potentialet til at revolutionere forskningen inden for humaniora.

For yderligere information og indsigt i de tekniske aspekter af håndskriftsgenkendelse, se projektsiderne Universitetet i Passau, DHC og Bop anbefales.