Maschinelles Übersetzen von Regional- und Minderheitensprachen

Interview mit Miriam Gerken

Stelle dich doch bitte kurz vor.

Ich bin Miriam Gerken, 25 Jahre alt. Ich habe Übersetzen studiert im Bachelor und dann im Master Computerlinguistik; habe mich also viel mit maschineller Übersetzung beschäftigt und jetzt arbeite ich seit Oktober letzten Jahres bei der Deutschen Bahn und betreue dort den Chatbot.

Du hast dich in deiner Masterarbeit mit der Übersetzung von Regional- und Minderheitensprachen im Verwaltungskontext beschäftigt. Was hat dich an dem Thema fasziniert?

Der Anfang kam durch ein Praktikum beim Europarat. Das war sehr spannend, weil ich für eine Hausarbeit in meinem Studiengang recherchiert habe und dann auf die Charta für Regional- oder Minderheitensprachen gestoßen bin. Ich fand es interessant, dass es ein Rechtsdokument gibt, von dem ich noch gar nichts wusste. Beim Europarat habe ich einen Bericht geschrieben, wie man mit modernen Sprachtechnologien den Sprachenschutz vereinfachen könnte. Eine der Methoden, die ich in dem Bericht immer wieder vorschlage, ist die maschinelle Übersetzung. Und dann habe ich mir überlegt, diese in meiner Masterarbeit anzuwenden und habe mich für den Bereich der Verwaltungsdokumente entschieden. Das ist ein relativ eingeschränkter Bereich mit begrenztem Vokabular und immer gleichen Formulierungen. Ich habe Obersorbisch und Niederdeutsch ausgewählt, weil es beim Obersorbischen schon viel zu dem Thema gibt und beim Niederdeutschen noch nicht so viel. Das lässt sich gut vergleichen. Und ich komme aus Niedersachsen und meine Großeltern sprechen auch immer Niederdeutschen, deswegen war die persönliche Verbindung da.

Du hast die Sprachencharta angesprochen: Was ist das für ein Instrument bzw. was besagt sie zu den Minderheiten- und Regionalsprachen?

Die Sprachencharta beschäftigt sich mit allen Bereichen, in denen Sprache verwendet wird, also in der Bildung, in den Medien, aber auch in Behörden. In der Charta ist festgelegt, wie man in den Bereichen Regional- und Minderheitensprachen schützen kann. Die Vertragsstaaten wählen verschiedene Maßnahmen zum Sprachenschutz aus, die sie umsetzen. Der Europarat überprüft, ob diese auch wirklich umgesetzt werden.

Über Artikel 10 - Verwaltung der Europäischen Sprachencharta ist u.a. festgelegt, dass Urkunden auf Niederdeutsch rechtsgültig vorgelegt werden können, dass Verwaltungsbehörden Schriftstücke auf Niederdeutsch abfassen können, dass der Gebrauch von Niederdeutsch innerhalb einer regionalen oder örtlichen Behörde zulässig ist und dass mündliche oder schriftliche Anträge auf Niederdeutsch gestellt werden dürfen. Ebenso dürfen amtliche Schriftstücke der regionalen Behörden auf Niederdeutsch veröffentlicht werden.

Weißt du, ob in der Verwaltung bereits maschinelle Übersetzung eingesetzt wird?

Soweit ich weiß noch nicht. Im Obersorbischen gibt es mittlerweile ein maschinelles Übersetzungsprogramm, aber noch nicht sehr lange. Ich meine, es wird nicht für den Bereich Verwaltung eingesetzt. Zu maschineller Übersetzung von Regional- und Minderheitensprachen liegen generell wenig Erfahrungen vor. Für das Walisische wird viel im Bereich Sprachtechnologie gemacht. Aber im Deutschen ist das noch ein komplett neuer Bereich.

Wo siehst du die größte Hürde beim maschinellen Übersetzen von Regional- und Minderheitensprachen und speziell beim Niederdeutschen?

Ich glaube, dass man gar nicht weiß, wie viele Möglichkeiten eigentlich hinter der Technologie stecken. Genau das wollte ich mit meinem Bericht verdeutlichen. Man muss erstmal ein Gespür dafür bekommen, was mit Sprachtechnologien überhaupt möglich ist. Und was auf jeden Fall fehlt, sind Daten! Also für jede Anwendung, sei es ein Chatbot oder maschinelle Übersetzung oder eine Datenanalyse. Für meine Masterarbeit brauchte ich sehr viele Daten, um mein System zu trainieren, und es war gar nicht so einfach diese aufzutreiben.
Beim Niederdeutschen waren viel zu wenig Daten vorhanden, insbesondere aus der Verwaltung. Ich habe die Landesverordnungen von Mecklenburg-Vorpommern und Schleswig-Holstein verwendet. Die unterschiedlichen niederdeutschen Varianten und Schreibweisen waren kein großes Problem, sondern es fehlten einfach übersetzte Daten!
Im Obersorbischen konnte ich zum Beispiel Satzungen benutzen - da gab es einfach schon viel mehr übersetzte Dokumente. Ich hatte den Eindruck, dass hier schon mehr in dem Bereich Datensammlung und Aufbau von Koropra passiert ist. Der größte Unterschied ist, wie viel Aufmerksamkeit dieses Thema bekommt.

Mit dem neuen Onlinezugangsgesetz ist es ab Ende 2022 möglich, in allen Behörden Anträge auf Niederdeutsch zu stellen. Meinst du, dass da die maschinelle Übersetzung auch eine Option ist, um diesen Ansprüchen für die digitalen Dokumente gerecht zu werden?

Auf jeden Fall! Die maschinelle Übersetzung ist ja generell nur für den schriftlichen Bereich geeignet und kann dort Unterstützung sein. Ich glaube, gerade bei online-Anträgen und schriftlichen Anträgen kann sie durchaus hilfreich sein. Das Problem ist, dass man sehr langfristig denken muss und nicht jetzt schon automatisch die Formulare übersetzen kann. Die Anträge und Formulare müssen erst einmal professionell übersetzt werden. Wenn sich später ein Formular ändert, könnte dies zum Beispiel maschinell umgesetzt werden.

Am besten jetzt schon Datensammeln?

Ja, das ist mein Hauptziel, in diesem Interview deutlich zu machen: Wir brauchen niederdeutsche Sprachdaten!

Was für andere Projekte gibt es, wo sich die maschinelle Übersetzung mit dem Niederdeutschen beschäftigt?

Konkret fällt mir nur ein privates Projekt ein. Ich habe mich mal mit Marcel Meyer ausgetauscht, der innerhalb von einem Programmier-Projekt einen Översetter erstellt hat. Viele Menschen nutzen sein Programm zum Übersetzen von Sätzen. Meist werden einfache Alltagssätze wie Begrüßungen ausprobiert. Vielleicht gibt es noch andere Projekte, die ich nicht kenne. Für andere Sprachen gibt es Onlinekorrektur-Funktionen, zum Beispiel bei Microsoft Word. Das ist auch Sprachtechnologie und das gibt es schon für einige Minderheitensprachen in Europa.

In welchen weiteren Bereichen kann man die maschinelle Übersetzung ins Niederdeutsche einsetzen?

In jedem Bereich, in dem das Vokabular relativ einfach und beschränkt ist und wo es eine klare Satzstruktur gibt. Im Literaturbereich würde es nicht funktionieren. Aber in Sozialen Medien wie zum Beispiel auf twitter gibt es ja manchmal solche Übersetzungsfunktionen. Das wäre ein Bereich, der fürs Niederdeutsche interessant wäre. Aber ich glaube, auch allgemein im Alltag wäre das automatische Übersetzen hilfreich, wie das Översetter-Projekt zeigt.

Zum Abschluss möchte ich dich noch fragen, was du dir für die Zukunft wünschst?

Mein Wunsch fürs Niederdeutsche ist auf jeden Fall, dass es einfach in allen Bereichen des Lebens ankommt. Dass es in Gerichten genauso gesprochen wird wie auf Facebook und auf der Straße und im Supermarkt und in der Politik. Und dass wir nicht mehr die Diskussion führen müssen, ob Niederdeutsch ein Dialekt oder eine Sprache ist. Das sind meine zwei Wünsche fürs Niederdeutsche und dann natürlich, dass der Bereich allgemein der Sprachtechnologien und des maschinellen Übersetzens ausgebaut wird und ein Bewusstsein dafür ensteht, dass es für Niederdeutsch ein sehr großer Vorteil sein kann, und dass darin viel Potential liegt.

Das Interview führte Nadine Koop, Werkstudentin im Niederdeutschsekretariat