Die Sprachencharta und moderne Sprachtechnologien

Dem Bereich Niederdeutsch in der Wissenschaft kommt eine große Bedeutung zu. Sowohl die Erforschung des Niederdeutschen in seinen gegenwärtigen Ausprägungen als auch die Lehre sind essentiell für den Diskurs über das Niederdeutsche sowie für den Fortbestand der Regionalsprache. Der Bundesraat för Nedderdüütsch erstellt momentan eine Informationsbroschüre, die einen Überblick geben soll, an welchen Universitäten Lehre und Forschung zu Niederdeutsch stattfindet und wie das Universitätsfach Niederdeutsch in das akademische Lehrangebot integriert ist. In der Broschüre werden aktuelle Forschungsprojekte der Universitäten im Sprachgebiet vorgestellt. Der Schwerpunkt der Projekte liegt auf der Erforschung des Niederdeutschen in seinen gegenwärtigen Ausprägungen. Weiter werden einige Bachelor- und Masterarbeiten sowie Dissertationen vorgestellt.
Die Broschüre wird Ende 2020 in gedruckter Form vorliegen sowie online abrufbar sein. Der Druck wird finanziert mit Fördermitteln des Ministeriums für Wissenschaft, Forschung und Kultur des Landes Brandenburg.

Einen ersten Einblick in die Broschüre gibt ein Beitrag, der sich mit einer auch für die Arbeit des BfN sehr interessanten Fragestellung beschäftigt. Miriam Gerken studiert Computerlinguistik an der Universität Bielefeld und hat Anfang des Jahres einen Bericht für den Europarat verfasst, in dem sie untersucht, wie die Verpflichtungen der Europäischen Sprachencharta mit modernen Sprachtechnologien besser umgesetzt werden können. Der ausführliche Text wird Ende 2020 vom Europarat veröffentlicht.

Wie können die Verpflichtungen der Europäischen Sprachencharta mit modernen Sprachtechnologien besser umgesetzt werden?

Die Europäische Charta der Regional- oder Minderheitensprachen hat seit ihrer Verfassung in den 1980er Jahren einige technologische Veränderungen miterlebt. So trug beispielsweise die Entwicklung des Internets dazu bei, Medienangebote zu erweitern, und machte die Forderung nach zusätzlichen Rundfunkfrequenzen für Regional- oder Minderheitensprachen überflüssig. Durch die zunehmende Verbreitung von KI-Technologien ergeben sich nun für die Umsetzung der Europäischen Sprachencharta neue Verpflichtungen, aber auch neue Möglichkeiten.
Anfang dieses Jahres habe ich über diese neuen Möglichkeiten einen Bericht für den Europarat verfasst. Hier möchte ich nun einen kleinen Einblick in diesen Bericht geben, und aufzeigen, wie Regional- und Minderheitensprachen von modernen Sprachtechnologien profitieren können.

Künstliche Intelligenz (KI) beschreibt im Allgemeinen intelligente Maschinen, die menschliche Fähigkeiten wie Lernen durch statistische Datenverarbeitung in neuronalen Netzen imitieren, um spezifische Probleme zu lösen. Die Verwendung von KI zur Verarbeitung sprachlicher Daten wird Natural Language Processing (Natürliche Sprachverarbeitung, NLP) genannt. Ziel des NLP ist die Entwicklung von Programmen zum Lesen, Verarbeiten, Analysieren und Verstehen von natürlichen Sprachen in all ihrer Komplexität. Um dieses Ziel zu erreichen, sind große Mengen an natürlichen Sprachdaten notwendig.

Zuerst können moderne Sprachtechnologien dabei helfen, die allgemeinen Ziele der Charta zu erreichen. So tragen die im Bericht beschriebenen Maßnahmen zum Beispiel zu einer erhöhten Sichtbarkeit der Regional- oder Minderheitensprachen bei. Wenn diese Sprachen z.B. in alltäglichen KI-Anwendungen wie Assistenzsystemen im Haushalt verwendet werden können, erweitert dies die Möglichkeiten der Sprachverwendung im Alltag, die Präsenz dieser Sprachen in der Gesellschaft und zusätzlich die Motivation für neue Sprachlernende. Außerdem sind die beschriebenen Möglichkeiten durchweg grenzüberschreitend und können leicht von anderen Regionen mit derselben Regional- oder Minderheitensprache übernommen werden. Durch die Verwendung desselben Programmiercodes mit anderen Sprachdaten können die meisten Anwendungen auch ohne Probleme auf weitere Regional- oder Minderheitensprachen übertragen werden. So fördert die Verwendung von KI zur Umsetzung der Sprachencharta den zwischenstaatlichen Austausch. Schlussendlich zeichnen sich moderne Sprachtechnologien meist auch durch einen deutlich geringeren finanziellen und zeitlichen Aufwand aus als ihre analogen Alternativen.

Vorteile für Regional- und Minderheitensprachen

Auch für spezifische Umsetzungen einzelner Forderungen der Charta sind moderne Sprachtechnologien hilfreich. Eine Auswahl möglicher Anwendungen ist in der nebenstehenden Tabelle gegeben. Als ein Sonderfall soll hier die maschinelle Übersetzung ausführlicher behandelt werden.
Viele Verpflichtungen der Charta beziehen sich auf die Übersetzung verschiedener Dokumente in Regional- oder Minderheitensprachen. Alle diese Maßnahmen könnten durch den Einsatz von maschineller Übersetzung mit einem geringeren zeitlichen und finanziellen Aufwand umgesetzt werden. Maschinelle Übersetzung ist damit für die Umsetzung der Sprachencharta von besonderer Relevanz.
Je nach vorhandener Datengrundlage der jeweiligen Sprache kann maschinelle Übersetzung dabei entweder verwendet werden, um einen Überblick über den grundlegenden Inhalt eines Textes zu erhalten, und daraufhin zu entscheiden, ob eine professionelle Übersetzung notwendig ist, oder aber zum kompletten Übersetzen eines Textes mit anschließender menschlicher Überprüfung des Ergebnisses. Für die Übersetzung können entweder bestehende maschinelle Übersetzungsangebote wie Google Translate verwendet werden, die bereits einige Regional- und Minderheitensprachen unterstützen, oder neue Übersetzungssysteme mit eigenen Sprachdaten trainiert werden. Online gibt es hierfür zahlreiche OpenSource-Angebote. Im Rahmen meiner Masterarbeit trainiere ich zurzeit ein solches System für Niederdeutsch und Obersorbisch, und hoffe damit aufzeigen zu können, dass maschinelle Übersetzung auch für Regional- und Minderheitensprachen möglich und gleichzeitig notwendig ist, damit diese Sprachen auch im Zeitalter moderner Sprachtechnologien relevant bleiben.
Grundlage für die maschinelle Übersetzung und alle weiteren genannten Maßnahmen ist die Verfügbarkeit relevanter Sprachdaten. Somit sollten alle Regional- und Minderheitensprachen, unabhängig von der Größe ihrer Sprachgemeinschaft, als ersten Schritt die Erhebung von natürlichen Sprachdaten durch die Zusammenstellung von Sprachkorpora in Angriff nehmen. Denn nur mit ausreichenden Daten ist die Nutzung moderner Sprachtechnologien für die Regional- und Minderheitensprachen möglich, mit der sich ihnen zahlreiche neue Möglichkeiten eröffnen, sich als lebendige, relevante und moderne Sprachen zu profilieren.

Miriam Gerken