Revolucija v prepoznavanju rokopisa: Nove priložnosti za raziskovanje!
Prof. dr. Rehbein in dr. Werth z Univerze v Passauu začenjata raziskovalni projekt o avtomatskem prepoznavanju rokopisa (2025-2027).

Revolucija v prepoznavanju rokopisa: Nove priložnosti za raziskovanje!
Raziskovalci na Univerzi v Passauu so začeli inovativen projekt o metodologiji napak pri samodejnem prepoznavanju rokopisa. Profesorja Malte Rehbein in Alexander Werth vodita projekt, ki je del linije financiranja Fundacije Volkswagen "Awakening". Projekt traja od leta 2025 do 2027 in se imenuje »Metodologija netočnih«.
Osrednji cilj tega projekta je raziskati, v kolikšni meri lahko napačni podatki omogočijo znanstveno delo. Uporabljajo se avtomatsko prepisani zgodovinski rokopisi iz koncilskih zapisnikov iz 17. do 19. stoletja, ki imajo približno 90-odstotno natančnost. Projekt bo te transkripcije primerjal z ročno prepisanimi podatki in dosegel 100-odstotno natančnost.
Znanstveni center "Metodikum"
Projekt je del znanstvenega centra »Methodikum«, ki so ga ustanovile katedre za večjezično računalniško jezikoslovje, računalniško humanistiko in germanistiko. Cilj »Metodikuma« je temeljno metodološko raziskovanje v humanistiki ter podpora računalniško podprtim in digitalnim metodam.
Pomembnost samodejnega prepoznavanja rokopisa poudarjajo tudi izzivi, s katerimi se soočajo stroji. Ljudje lahko razvozlamo pisavo, medtem ko je ta sposobnost za stroje veliko bolj zapletena. Tobias Hodel iz züriškega državnega arhiva poroča o napredku pri avtomatiziranem prepoznavanju rokopisa v projektih, kot je READ, ki ga financira Evropska komisija in je namenjen prepisovanju velikih količin rokopisnih dokumentov.
Tehnološka podpora in stopnja razvoja
Osrednje orodje v tem kontekstu je brezplačna programska oprema Transkribus, ki poleg samodejnega prepoznavanja in prepisovanja omogoča tudi iskanje zgodovinskih dokumentov. Ta programska oprema se je uveljavila kot dragoceno orodje za arhive, knjižnice in dokumentacijske ustanove.
Uporaba Transkribusa zahteva ustvarjanje podatkov za usposabljanje z ročnim prepisom, kar je zamudno, vendar lahko bistveno izboljša kakovost prepoznave. Trenutni rezultati kažejo, da lahko nekateri modeli programske opreme dosežejo stopnjo znakovnih napak (CER) manj kot 1 %, kar predstavlja izjemno natančnost za specifične besedilne korpuse. Transkribus ponuja tudi različna orodja za izdelavo lastnih modelov, prilagojenih potrebam uporabnika.
Ker je tehnologija napredovala, je v zadnjih letih prišlo do pomembnih izboljšav pri prepoznavanju rokopisa. Kakovost samodejnih prepisov je odvisna predvsem od uporabljene pisave in števila uporabljenih rok. Kljub temu napredku ostaja izziv, da stroji trenutno ne morejo doseči 0-odstotne stopnje napake, pri čemer so sprejemljive ravni za človeške prepise pod 10-odstotnim.
Na splošno razvoj avtomatiziranega prepoznavanja rokopisa kaže, kako lahko kombinacija človeške in strojne inteligence obogati znanstveno delo in bistveno pospeši digitalizacijo zgodovinskih fondov. Vse večja učinkovitost transkripcije, podprta s tehnologijo HTR, odpira nove možnosti za zgodovinske raziskave in razvoj dragocenih informacij iz arhivskega gradiva. Sodelovanje med znanstveniki in sodobnimi tehnologijami lahko spremeni raziskave v humanistiki.
Za dodatne informacije in vpogled v tehnične vidike prepoznavanja rokopisa si oglejte strani projekta Univerza v Passauu, DHC in Bop priporočljivo.