手写识别的革命:研究的新机遇!
帕绍大学的 Rehbein 教授、博士和 Werth 博士正在启动一项自动手写识别研究项目(2025-2027 年)。

手写识别的革命:研究的新机遇!
帕绍大学的研究人员启动了一个关于自动手写识别错误方法的创新项目。 Malte Rehbein 和 Alexander Werth 教授领导了该项目,该项目是大众基金会“觉醒”资助项目的一部分。该项目的持续时间从2025年延长至2027年,被称为“不准确的方法论”。
该项目的中心目标是调查不正确的数据在多大程度上能够促进科学工作。使用自动转录的 17 世纪至 19 世纪议会会议记录历史手稿,准确率约为 90%。该项目将这些转录与手动转录的数据进行比较,达到 100% 的准确性。
“美多迪库姆”科学中心
该项目是“Methodikum”科学中心的一部分,该中心由多语言计算语言学、计算人文学科和德语语言学教授创立。 “Methodikum”的目标是人文学科的基础方法论研究以及计算机辅助和数字方法的支持。
机器面临的挑战也凸显了自动手写识别的相关性。人类能够解读手写体,而这种能力对于机器来说要复杂得多。苏黎世国家档案馆的 Tobias Hodel 报告了 READ 等项目中自动手写识别的进展,该项目由欧盟委员会资助,旨在转录大量手写文档。
技术支持及发展水平
这方面的一个核心工具是免费的 Transkribus 软件,它不仅可以自动识别和转录,还可以搜索历史文档。该软件已成为档案馆、图书馆和文献机构的宝贵工具。
使用 Transkribus 需要通过手动转录来创建训练数据,虽然非常耗时,但可以显着提高识别质量。目前的结果表明,该软件的某些模型可以实现小于1%的字符错误率(CER),这对于特定文本语料库来说具有显着的准确性。 Transkribus 还提供各种工具来创建您自己的模型,以满足用户的各自需求。
随着技术的进步,近年来手写识别技术有了显着的进步。自动转录的质量主要取决于使用的字体和使用的手数。尽管取得了这些进步,但挑战仍然是机器目前无法实现 0% 的错误率,而人类转录的可接受水平低于 10%。
总体而言,自动手写识别的发展表明,人类和机器智能的结合如何能够丰富科学工作并显着推进历史馆藏的数字化。在 HTR 技术的支持下,转录效率不断提高,为历史研究和从档案材料中开发有价值的信息开辟了新的机遇。科学家与现代技术之间的合作有可能彻底改变人文学科的研究。