Revolúcia v rozpoznávaní rukopisu: Nové príležitosti pre výskum!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof. Dr. Rehbein a Dr. Werth z univerzity v Passau začínajú výskumný projekt automatického rozpoznávania rukopisu (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof. Dr. Rehbein a Dr. Werth z univerzity v Passau začínajú výskumný projekt automatického rozpoznávania rukopisu (2025-2027).

Revolúcia v rozpoznávaní rukopisu: Nové príležitosti pre výskum!

Vedci z Passauskej univerzity spustili inovatívny projekt metodológie chýb pri automatickom rozpoznávaní rukopisu. Profesori Malte Rehbein a Alexander Werth vedú projekt, ktorý je súčasťou línie financovania „Awakening“ Nadácie Volkswagen. Trvanie projektu je od roku 2025 do roku 2027 a nazýva sa „Metodológia nepresných“.

Hlavným cieľom tohto projektu je preskúmať, do akej miery môžu nesprávne údaje umožniť vedeckú prácu. Používajú sa automaticky prepísané historické rukopisy z koncilových zápisníc zo 17. až 19. storočia, ktoré majú presnosť okolo 90 %. Projekt porovná tieto prepisy s ručne prepísanými údajmi, čím sa dosiahne 100% presnosť.

Vedecké centrum „Methodikum“

Projekt je súčasťou vedeckého centra „Methodikum“, ktoré bolo založené katedrami viacjazyčnej počítačovej lingvistiky, počítačovej humanitnej vedy a nemeckej lingvistiky. Cieľom „Metodika“ je základný metodologický výskum v humanitných vedách, ako aj podpora počítačom podporovaných a digitálnych metód.

Význam automatického rozpoznávania rukopisu podčiarkujú aj výzvy, ktorým čelia stroje. Ľudia sú schopní dešifrovať rukopis, zatiaľ čo pre stroje je táto schopnosť oveľa zložitejšia. Tobias Hodel zo Štátneho archívu v Zürichu informuje o pokroku v automatizovanom rozpoznávaní rukopisu v projektoch ako READ, ktorý je financovaný Európskou komisiou a jeho cieľom je prepisovanie veľkého množstva ručne písaných dokumentov.

Technologická podpora a úroveň rozvoja

Ústredným nástrojom je v tejto súvislosti bezplatný softvér Transkribus, ktorý umožňuje nielen automatické rozpoznávanie a prepis, ale aj vyhľadávanie historických dokumentov. Tento softvér sa etabloval ako cenný nástroj pre archívy, knižnice a dokumentačné inštitúcie.

Používanie Transkribusu vyžaduje vytváranie tréningových dát pomocou manuálneho prepisu, čo je časovo náročné, ale môže výrazne zlepšiť kvalitu rozpoznávania. Súčasné výsledky ukazujú, že niektoré modely softvéru dokážu dosiahnuť mieru chybovosti znakov (CER) menej ako 1 %, čo predstavuje pozoruhodnú presnosť pre špecifické textové korpusy. Transkribus tiež ponúka rôzne nástroje na vytváranie vlastných modelov prispôsobených príslušným potrebám užívateľa.

Ako technológia pokročila, v posledných rokoch došlo k významným zlepšeniam v rozpoznávaní rukopisu. Kvalita automatického prepisu závisí predovšetkým od použitého písma a počtu použitých rúk. Napriek týmto pokrokom zostáva výzvou, že stroje v súčasnosti nie sú schopné dosiahnuť 0 % chybovosť, pričom prijateľné úrovne pre ľudské prepisy sú nižšie ako 10 %.

Celkovo vývoj v automatizovanom rozpoznávaní rukopisu ukazuje, ako môže kombinácia ľudskej a strojovej inteligencie obohatiť vedeckú prácu a výrazne posunúť vpred digitalizáciu historických fondov. Zvyšujúca sa efektivita prepisu podporovaná technológiou HTR otvára nové možnosti pre historický výskum a rozvoj cenných informácií z archívnych materiálov. Spolupráca medzi vedcami a modernými technológiami má potenciál spôsobiť revolúciu vo výskume v humanitných vedách.

Ďalšie informácie a pohľady na technické aspekty rozpoznávania rukopisu nájdete na stránkach projektu Univerzita v Passau, DHC a Bop odporúčané.