Plattdeutsch - ist es möglich dem Computer die gefährdete Sprache beizubringen?
Der Översetter unternimmt zumindest den ersten Schritt mit dem ersten speziell entwickeltem Tool, das hochdeutsche
Sätze ins Plattdeutsche übersetzen kann.
Die Grundlage des Översetters hat Marcel Meyer innerhalb von vier Wochen als Abschlussprojekt des Bootcamps Data
Science bei neuefische GmbH programmiert.
Für die Übersetzung wird ein künstliches neuronales Netz eingesetzt (Neural Machine Translation).
Die größte Herausforderung ist jedoch die Datenbasis. Für gute Übersetzungen werden möglichst viele hochqualitative
hochdeutsch-plattdeutsch Satzpaare benötigt.
Der Översetter arbeitet derzeit mit den öffentlich zugänglichen Datenquellen
Tatoeba.org (Nutzungslizenz CC BY 2.0 FR)
und der Satzpaar-Kollektion WikiMatrix
(Wissenschaftliches Paper).
Falls ihr weitere Daten zum Training des Algorithmus zur Verfügung stellen könnt, freuen wir uns sehr! Bitte einfach
eine E-Mail an moin@översetter.de senden.
Weiterhin kann der Algorithmus durch die Schoolmeester-Funktion verbessert werden, indem die Übersetzungen
korrigiert werden.
Plattdeutsch lebt im Alltag durch die Gemeinschaft - diesen Gedanken greift der Översetter auf und stellt den Code
offen auf
Github zur Verfügung.
Jeder der Interesse hat, ist herzlich eingeladen an diesem Projekt mitzuarbeiten. Sei es die Übersetzungen oder den
Code zu verbessern oder das Projekt allgemein zu unterstützen.