Forradalom a kézírás-felismerésben: Új lehetőségek a kutatásban!
Prof. Dr. Rehbein és Dr. Werth a Passaui Egyetemről kutatási projektbe kezd az automatikus kézírás-felismerésről (2025-2027).

Forradalom a kézírás-felismerésben: Új lehetőségek a kutatásban!
A Passau Egyetem kutatói innovatív projektet indítottak az automatikus kézírás-felismerés hibamódszertanáról. Malte Rehbein és Alexander Werth professzorok vezetik a projektet, amely a Volkswagen Alapítvány „Ébredés” finanszírozási vonalának része. A projekt időtartama 2025-től 2027-ig tart, és „A pontatlanok módszertanának” nevezik.
A projekt központi célja annak vizsgálata, hogy a helytelen adatok milyen mértékben teszik lehetővé a tudományos munkát. A 17-19. századi tanácsi jegyzőkönyvekből automatikusan átírt történelmi kéziratokat használnak, amelyek pontossága 90% körüli. A projekt összehasonlítja ezeket az átírásokat a manuálisan átírt adatokkal, így 100%-os pontosságot ér el.
"Methodikum" Tudományos Központ
A projekt a „Methodikum” tudományos központ része, amelyet többnyelvű számítógépes nyelvészeti, számítógépes humán és német nyelvészeti tanszékek alapítottak. A „Methodikum” célja a humán tudományok módszertani alapkutatása, valamint a számítógépes és digitális módszerek támogatása.
Az automatikus kézírás-felismerés jelentőségét a gépek előtt álló kihívások is alátámasztják. Az emberek képesek megfejteni a kézírást, míg a gépeknél ez a képesség sokkal összetettebb. Tobias Hodel, a Zürichi Állami Levéltár munkatársa beszámol az automatizált kézírás-felismerés terén elért előrehaladásról olyan projektekben, mint például a READ, amelyet az Európai Bizottság finanszíroz, és amelynek célja nagy mennyiségű kézzel írott dokumentum átírása.
Technológiai támogatottság és fejlettségi szint
Ebben az összefüggésben központi eszköz az ingyenes Transkribus szoftver, amely nemcsak automatikus felismerést és átírást tesz lehetővé, hanem történelmi dokumentumok keresését is. Ez a szoftver értékes eszközzé vált a levéltárak, könyvtárak és dokumentációs intézmények számára.
A Transkribus használatához edzési adatok kézi átírással történő létrehozása szükséges, ami időigényes, de jelentősen javíthatja a felismerés minőségét. A jelenlegi eredmények azt mutatják, hogy a szoftver egyes modelljei 1%-nál kisebb karakterhiba-arányt (CER) tudnak elérni, ami figyelemre méltó pontosságot jelent bizonyos szövegkorpusok esetében. A Transkribus különféle eszközöket is kínál saját modellek elkészítéséhez, a felhasználó mindenkori igényeihez igazítva.
A technológia fejlődésével az elmúlt években jelentős fejlesztések történtek a kézírás-felismerés terén. Az automatikus átírások minősége elsősorban a használt betűtípustól és a használt kezek számától függ. E fejlesztések ellenére továbbra is az a kihívás, hogy a gépek jelenleg nem képesek 0%-os hibaarányt elérni, az emberi átírások elfogadható szintje pedig 10% alatt van.
Összességében az automatizált kézírás-felismerés fejlődése azt mutatja, hogy az emberi és a gépi intelligencia kombinációja hogyan gazdagítja a tudományos munkát, és jelentősen előmozdítja a történelmi állományok digitalizálását. A HTR technológiával támogatott transzkripció hatékonyságának növekedése új lehetőségeket nyit a történeti kutatások és a levéltári anyagokból származó értékes információk előállítása számára. A tudósok és a modern technológiák közötti együttműködés forradalmasíthatja a humán tudományok kutatását.
A kézírás-felismerés technikai vonatkozásaival kapcsolatos további információkért és betekintésekért tekintse meg a projekt oldalait Passaui Egyetem, DHC és Bop ajánlott.