Revoluce v rozpoznávání rukopisu: Nové příležitosti pro výzkum!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof. Dr. Rehbein a Dr. Werth z univerzity v Pasově zahajují výzkumný projekt automatického rozpoznávání rukopisu (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof. Dr. Rehbein a Dr. Werth z univerzity v Pasově zahajují výzkumný projekt automatického rozpoznávání rukopisu (2025-2027).

Revoluce v rozpoznávání rukopisu: Nové příležitosti pro výzkum!

Vědci z univerzity v Pasově zahájili inovativní projekt metodologie chyb v automatickém rozpoznávání rukopisu. Profesoři Malte Rehbein a Alexander Werth vedou projekt, který je součástí finanční linie „Probuzení“ Nadace Volkswagen. Doba trvání projektu je od roku 2025 do roku 2027 a nazývá se „Metodologie nepřesných“.

Ústředním cílem tohoto projektu je prozkoumat, do jaké míry mohou nesprávná data umožnit vědeckou práci. Používají se automaticky přepisované historické rukopisy z radních zápisů ze 17. až 19. století, které mají přesnost kolem 90 %. Projekt porovná tyto přepisy s ručně přepsanými daty a dosáhne 100% přesnosti.

Vědecké centrum "Methodikum"

Projekt je součástí vědeckého centra „Methodikum“, které bylo založeno katedrami pro vícejazyčnou počítačovou lingvistiku, výpočetní humanitní vědy a německou lingvistiku. Cílem „Metodika“ je základní metodologický výzkum v humanitních vědách a také podpora počítačově podporovaných a digitálních metod.

Relevantnost automatického rozpoznávání rukopisu je také podtržena výzvami, kterým stroje čelí. Lidé jsou schopni dešifrovat rukopis, zatímco u strojů je tato schopnost mnohem složitější. Tobias Hodel z Curyšského státního archivu informuje o pokroku v automatickém rozpoznávání rukopisu v projektech, jako je READ, který je financován Evropskou komisí a jehož cílem je přepis velkého množství ručně psaných dokumentů.

Technologická podpora a úroveň rozvoje

Ústředním nástrojem je v této souvislosti bezplatný software Transkribus, který umožňuje nejen automatické rozpoznávání a přepis, ale také vyhledávání historických dokumentů. Tento software se etabloval jako cenný nástroj pro archivy, knihovny a dokumentační instituce.

Použití Transkribusu vyžaduje vytvoření trénovacích dat pomocí ručního přepisu, což je časově náročné, ale může výrazně zlepšit kvalitu rozpoznávání. Současné výsledky ukazují, že některé modely softwaru mohou dosahovat Character Error Rate (CER) menší než 1 %, což představuje pozoruhodnou přesnost pro konkrétní textové korpusy. Transkribus také nabízí různé nástroje pro tvorbu vlastních modelů, přizpůsobených příslušným potřebám uživatele.

Jak technologie pokročila, došlo v posledních letech k významným zlepšením v rozpoznávání rukopisu. Kvalita automatických přepisů závisí především na použitém fontu a počtu použitých rukou. Navzdory těmto pokrokům zůstává problémem, že stroje v současnosti nejsou schopny dosáhnout 0% chybovosti, přičemž přijatelné úrovně pro lidské přepisy jsou nižší než 10 %.

Celkově vývoj v oblasti automatického rozpoznávání rukopisu ukazuje, jak může kombinace lidské a strojové inteligence obohatit vědeckou práci a významně posunout digitalizaci historických fondů. Zvyšující se efektivita přepisu podporovaná technologií HTR otevírá nové možnosti pro historický výzkum a rozvoj cenných informací z archivních materiálů. Spolupráce mezi vědci a moderními technologiemi má potenciál způsobit revoluci ve výzkumu v humanitních oborech.

Další informace a náhledy na technické aspekty rozpoznávání rukopisu naleznete na stránkách projektu univerzitě v Pasově, DHC a Bop doporučeno.