Revolusjon innen håndskriftgjenkjenning: Nye muligheter for forskning!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof. Dr. Rehbein og Dr. Werth fra University of Passau starter et forskningsprosjekt om automatisk håndskriftgjenkjenning (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof. Dr. Rehbein og Dr. Werth fra University of Passau starter et forskningsprosjekt om automatisk håndskriftgjenkjenning (2025-2027).

Revolusjon innen håndskriftgjenkjenning: Nye muligheter for forskning!

Forskere ved Universitetet i Passau har lansert et nyskapende prosjekt om feilmetodikk i automatisk håndskriftsgjenkjenning. Professorene Malte Rehbein og Alexander Werth leder prosjektet, som er en del av Volkswagen Foundations «Awakening»-finansieringslinje. Prosjektets varighet strekker seg fra 2025 til 2027 og kalles "Methodology of the Unaccurate".

Det sentrale målet med dette prosjektet er å undersøke i hvilken grad feil data kan muliggjøre vitenskapelig arbeid. Det brukes automatisk transkriberte historiske manuskripter fra rådsreferat fra 1600- til 1800-tallet, som har en nøyaktighet på rundt 90 %. Prosjektet vil sammenligne disse transkripsjonene med manuelt transkriberte data, og oppnå 100 % nøyaktighet.

Vitensenteret "Metodikum"

Prosjektet er en del av "Metodikum" vitenskapssenteret, som ble grunnlagt av lærestoler for flerspråklig datalingvistikk, datavitenskapelig humaniora og tysk språkvitenskap. Målet med "Metodikum" er grunnleggende metodologisk forskning innen humaniora, samt støtte til datastøttede og digitale metoder.

Relevansen av automatisk håndskriftgjenkjenning understrekes også av utfordringene maskiner står overfor. Mennesker er i stand til å tyde håndskrift, mens denne evnen er mye mer kompleks for maskiner. Tobias Hodel fra Zürichs statsarkiv rapporterer om fremgangen innen automatisert håndskriftgjenkjenning i prosjekter som READ, som er finansiert av EU-kommisjonen og har som mål å transkribere store mengder håndskrevne dokumenter.

Teknologisk støtte og utviklingsnivå

Et sentralt verktøy i denne sammenhengen er den gratis programvaren Transkribus, som ikke bare muliggjør automatisk gjenkjenning og transkripsjon, men også søk i historiske dokumenter. Denne programvaren har etablert seg som et verdifullt verktøy for arkiver, biblioteker og dokumentasjonsinstitusjoner.

Bruk av Transkribus krever å lage opplæringsdata gjennom manuell transkripsjon, noe som er tidkrevende, men kan forbedre kvaliteten på gjenkjenningen betydelig. Nåværende resultater viser at noen modeller av programvaren kan oppnå en Character Error Rate (CER) på mindre enn 1 %, noe som representerer bemerkelsesverdig nøyaktighet for spesifikke tekstkorpus. Transkribus tilbyr også ulike verktøy for å lage dine egne modeller, tilpasset de respektive behovene til brukeren.

Etter hvert som teknologien har utviklet seg, har det vært betydelige forbedringer i håndskriftgjenkjenning de siste årene. Kvaliteten på de automatiske transkripsjonene avhenger først og fremst av fonten som brukes og antall hender som brukes. Til tross for disse fremskrittene gjenstår utfordringen at maskiner foreløpig ikke er i stand til å oppnå en feilrate på 0 %, med akseptable nivåer for menneskelige transkripsjoner på under 10 %.

Samlet sett viser utviklingen innen automatisert håndskriftgjenkjenning hvordan kombinasjonen av menneskelig og maskinell intelligens kan berike vitenskapelig arbeid og betydelig fremme digitaliseringen av historiske beholdninger. Den økende effektiviteten til transkripsjon, støttet av HTR-teknologi, åpner for nye muligheter for historisk forskning og utvikling av verdifull informasjon fra arkivmateriale. Samarbeid mellom forskere og moderne teknologi har potensial til å revolusjonere forskningen innen humaniora.

For ytterligere informasjon og innsikt i de tekniske aspektene ved håndskriftgjenkjenning, se prosjektsidene Universitetet i Passau, DHC og Bop anbefales.