Revolucija u prepoznavanju rukopisa: Nove prilike za istraživanje!
Prof. dr. Rehbein i dr. Werth sa Sveučilišta Passau započinju istraživački projekt o automatskom prepoznavanju rukopisa (2025.-2027.).

Revolucija u prepoznavanju rukopisa: Nove prilike za istraživanje!
Istraživači sa Sveučilišta Passau pokrenuli su inovativni projekt o metodologiji pogrešaka u automatskom prepoznavanju rukopisa. Profesori Malte Rehbein i Alexander Werth vode projekt, koji je dio linije financiranja Volkswagenove zaklade "Awakening". Projekt traje od 2025. do 2027. godine i nosi naziv “Metodologija netočnih”.
Središnji cilj ovog projekta je istražiti u kojoj mjeri netočni podaci mogu omogućiti znanstveni rad. Koriste se automatski prepisani povijesni rukopisi iz koncilskih zapisnika iz 17. do 19. stoljeća, koji imaju točnost od oko 90%. Projekt će usporediti te transkripcije s ručno prepisanim podacima, postižući 100% točnost.
Znanstveni centar “Metodikum”
Projekt je dio znanstvenog centra “Methodikum” koji su osnovale katedre za višejezičnu računalnu lingvistiku, računalne humanističke znanosti i germanistiku. Cilj “Methodikuma” je temeljno metodološko istraživanje u humanističkim znanostima te potpora računalno potpomognutim i digitalnim metodama.
Važnost automatskog prepoznavanja rukopisa također je naglašena izazovima s kojima se suočavaju strojevi. Ljudi mogu dešifrirati rukopis, dok je ta sposobnost za strojeve mnogo složenija. Tobias Hodel iz Državnog arhiva u Zürichu izvješćuje o napretku u automatiziranom prepoznavanju rukopisa u projektima kao što je READ, koji financira Europska komisija i koji ima za cilj prepisati velike količine rukom pisanih dokumenata.
Tehnološka podrška i stupanj razvoja
Središnji alat u tom kontekstu je besplatni softver Transkribus koji ne samo da omogućuje automatsko prepoznavanje i transkripciju, već i pretraživanje povijesnih dokumenata. Ovaj se softver etablirao kao vrijedan alat za arhive, knjižnice i dokumentacijske ustanove.
Korištenje Transkribusa zahtijeva stvaranje podataka za obuku putem ručnog prijepisa, što je dugotrajno, ali može značajno poboljšati kvalitetu prepoznavanja. Trenutačni rezultati pokazuju da neki modeli softvera mogu postići stopu znakovnih pogrešaka (CER) manju od 1%, što predstavlja izvanrednu točnost za određene tekstualne korpuse. Transkribus također nudi razne alate za izradu vlastitih modela, prilagođenih pojedinačnim potrebama korisnika.
Kako je tehnologija napredovala, došlo je do značajnih poboljšanja u prepoznavanju rukopisa posljednjih godina. Kvaliteta automatskih prijepisa prvenstveno ovisi o korištenom fontu i broju korištenih ruku. Unatoč ovom napretku, ostaje izazov to što strojevi trenutno ne mogu postići stopu pogreške od 0%, dok su prihvatljive razine za ljudske transkripcije ispod 10%.
Sve u svemu, razvoj automatiziranog prepoznavanja rukopisa pokazuje kako kombinacija ljudske i strojne inteligencije može obogatiti znanstveni rad i značajno unaprijediti digitalizaciju povijesne građe. Sve veća učinkovitost transkripcije, podržana HTR tehnologijom, otvara nove mogućnosti za povijesna istraživanja i razvoj vrijednih informacija iz arhivske građe. Suradnja između znanstvenika i modernih tehnologija ima potencijal revolucionirati istraživanja u humanističkim znanostima.
Za daljnje informacije i uvide u tehničke aspekte prepoznavanja rukopisa pogledajte stranice projekta Sveučilište u Passauu, DHC i Bop preporučeno.