Revolutsioon käekirjatuvastuses: uued võimalused uurimistööks!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof dr Rehbein ja dr Werth Passau ülikoolist alustavad automaatse käekirjatuvastuse uurimisprojekti (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof dr Rehbein ja dr Werth Passau ülikoolist alustavad automaatse käekirjatuvastuse uurimisprojekti (2025-2027).

Revolutsioon käekirjatuvastuses: uued võimalused uurimistööks!

Passau ülikooli teadlased on käivitanud uuendusliku projekti, mis käsitleb automaatse käekirjatuvastuse vigade metoodikat. Professorid Malte Rehbein ja Alexander Werth juhivad projekti, mis on osa Volkswageni fondi rahastamisliinist "Ärkamine". Projekti kestus ulatub 2025. aastast 2027. aastani ja kannab nime “Ebatäpsete metoodika”.

Selle projekti keskne eesmärk on uurida, mil määral võivad ebaõiged andmed võimaldada teaduslikku tööd. Kasutatakse 17.–19. sajandi volikogu protokollidest automaatselt transkribeeritud ajaloolisi käsikirju, mille täpsus on umbes 90%. Projekti käigus võrreldakse neid transkriptsioone käsitsi transkribeeritud andmetega, saavutades 100% täpsuse.

Teaduskeskus "Methodikum"

Projekt on osa teaduskeskusest "Methodikum", mille asutasid mitmekeelse arvutilingvistika, arvutushumanitaaria ja saksa keeleteaduse õppetoolid. “Metoodikumi” eesmärgiks on humanitaarteaduste metodoloogilised alusuuringud ning arvuti- ja digitaalmeetodite toetamine.

Automaatse käsitsikirjatuvastuse asjakohasust rõhutavad ka masinate ees seisvad väljakutsed. Inimesed suudavad dešifreerida käekirja, samas kui masinate puhul on see võime palju keerulisem. Tobias Hodel Zürichi osariigiarhiivist raporteerib automatiseeritud käekirjatuvastuse edusammudest sellistes projektides nagu READ, mida rahastab Euroopa Komisjon ja mille eesmärk on transkribeerida suures koguses käsitsi kirjutatud dokumente.

Tehnoloogiline tugi ja arengutase

Keskseks töövahendiks selles kontekstis on tasuta tarkvara Transkribus, mis võimaldab lisaks automaatsele tuvastamisele ja transkriptsioonile otsida ka ajaloodokumente. See tarkvara on end tõestanud väärtusliku tööriistana arhiivide, raamatukogude ja dokumentatsiooniasutuste jaoks.

Transkribuse kasutamine eeldab treeningandmete loomist käsitsi transkriptsiooni abil, mis on aeganõudev, kuid võib oluliselt parandada tuvastamise kvaliteeti. Praegused tulemused näitavad, et mõned tarkvaramudelid võivad saavutada märgi veamäära (CER) alla 1%, mis tähistab konkreetsete tekstikorpuste puhul märkimisväärset täpsust. Transkribus pakub ka erinevaid tööriistu oma mudelite loomiseks, mis on kohandatud kasutaja vastavatele vajadustele.

Kuna tehnoloogia on arenenud, on viimastel aastatel käekirjatuvastus oluliselt paranenud. Automaatsete transkriptsioonide kvaliteet sõltub peamiselt kasutatavast fondist ja kasutatavate käte arvust. Hoolimata nendest edusammudest on endiselt väljakutseks see, et masinad ei suuda praegu saavutada 0% veamäära ja inimeste transkriptsioonide vastuvõetav tase on alla 10%.

Üldiselt näitab automatiseeritud käekirjatuvastuse areng, kuidas inimese ja masina intelligentsuse kombinatsioon võib teadustööd rikastada ja märkimisväärselt edendada ajalooliste fondide digiteerimist. Transkriptsiooni efektiivsuse kasv, mida toetab HTR-tehnoloogia, avab uusi võimalusi ajaloouuringuteks ja arhiivimaterjalidest väärtusliku teabe väljatöötamiseks. Teadlaste ja kaasaegsete tehnoloogiate vaheline koostöö võib humanitaarteaduste teadusuuringuid revolutsiooniliselt muuta.

Lisateabe saamiseks ja käsikirjatuvastuse tehniliste aspektide kohta vaadake projekti lehti Passau ülikool, DHC ja Bop soovitatav.