Auf dem Weg zur Digitalisierung stehen viele Herausforderungen an, insbesondere in der Regionalsprachenforschung. Rund 35 Wissenschaftler*innen aus sieben Ländern haben sich in einem neuen Positionspapier zusammengefunden, um die Bedeutung von Dialekten und Regionalsprachen in der Künstlichen Intelligenz (KI) hervorzuheben. Das Forschungszentrum Deutscher Sprachatlas (DSA) an der Universität Marburg führt dieses wichtige Projekt und hat damit den Grundstein für ein Netzwerk gelegt, das sich mit dem Potenzial von KI für die kulturelle Vielfalt auseinandersetzt.

Prof. Dr. Alfred Lameli, einer der Initiatoren, betont die Notwendigkeit einer fundierten Zusammenarbeit zwischen der KI-Forschung und der Sprachwissenschaft. Gegenwärtig werden Sprachmodelle überwiegend mit Texten und Aufnahmen in Standardsprache trainiert. Dialekte bleiben dabei weitgehend unsichtbar. Diese Vernachlässigung hat erhebliche Konsequenzen: Ältere Menschen und Bewohner ländlicher Regionen sind oft benachteiligt, da ihre sprachlichen Besonderheiten nicht angemessen berücksichtigt werden.

Handlungsbedarf in der KI-Forschung

Das Positionspapier, das im Open Access in der Zeitschrift für Dialektologie und Linguistik veröffentlicht wurde, bietet nicht nur eine fachliche Standortbestimmung, sondern auch Leitlinien für zukünftige Forschungs- und Infrastrukturprojekte. Ziel ist es, die Digitalisierung regionaler Sprachen gemäß den FAIR-Prinzipien zu gewährleisten: Findable, Accessible, Interoperable, Reusable.

Um dem bestehenden Mangel an hochwertigen Daten für Dialekte entgegenzuwirken, fordert das Papier die Entwicklung eines einheitlichen Ansatzes zur Digitalisierung. Dies könnte einen bedeutenden Schritt hin zu einem Übersetzungstool für Dialekte darstellen, das auf den umfassenden Daten des Deutschen Sprachatlas basiert.

Kulturelle Identität und Vorurteile

Ein weiterer Aspekt, der in der Diskussion um regionalsprachliche Vielfalt nicht zu kurz kommen darf, ist die gesellschaftliche Wahrnehmung von Dialekten. Eine Studie von den Universitäten Mainz und Hamburg zeigt, dass KI-Modelle wie ChatGPT signifikante Vorurteile gegenüber Dialektsprechern aufweisen. Diese Vorurteile sind tief in der Gesellschaft verwurzelt und führen dazu, dass Dialektsprechern negative Eigenschaften wie „ungebildet“ oder „unfreundlich“ zugeschrieben werden. Dadurch erfahren sie in Schule und Beruf oft Benachteiligungen, erhalten schlechtere Noten und haben geringere Chancen bei Bewerbungen.

Im Vergleich zu Englisch wird im Deutschen weniger Wert auf die Vermeidung solcher Diskriminierungen in KI-Modellen gelegt. Das führt dazu, dass in der digitalen Welt die vielfältigen Facetten der deutschen Sprachlandschaft oft ignoriert bleiben, während im Englischen bereits Fortschritte erzielt wurden. Dialekte stellen jedoch nicht nur eine sprachliche, sondern auch eine kulturelle Bereicherung dar.

Die Schlussfolgerungen aus dem Workshop, der im August 2025 stattfand und den Grundstein für das Netzwerk legte, ermutigen dazu, die Rolle der regionalen Sprachvielfalt aktiv zu diskutieren und auszubauen. Der interdisziplinäre Austausch soll inspirieren und zu einer verantwortungsvollen Gestaltung der KI-Entwicklung beitragen. Diese Bemühungen könnten helfen, die Balance zwischen technologischen Fortschritten und dem Erhalt kultureller Identität zu wahren.

Im Kontext dieser wichtigen Themen bleibt zu hoffen, dass die nächsten Schritte in der KI-Forschung eine fairere Behandlung von Dialekten fördern und eine Veränderung in der Wahrnehmung von Dialektsprechern bewirken. Die Herausforderungen sind klar umrissen, und die wissenschaftliche Gemeinschaft ist gefordert, Lösungen zu finden, die allen Sprachgemeinschaften gerecht werden.