von Ellen Göppl
Maschinelle Übersetzungen sorgen im Vergleich zu früher für große Begeisterung bei Nutzern: Seit die neuronale Variante von Google Translate, DeepL (zu dem auch Linguee gehört) und anderen Anbietern auch in deren öffentlich und kostenlos zugänglichen Tools verwendet wird, klingen damit erstellte Übersetzungen deutlich flüssiger und idiomatischer. Vor einigen Jahren wurde noch gerne über die teils sehr holprigen Ergebnisse gelacht – doch inzwischen staunen selbst Sprachprofis über die Qualität maschineller Übersetzung.
Die neuronale maschinelle Übersetzung (NMT) ist eine statistikbasierte Methode, bei der die „Maschine“ mit einem extrem umfangreichen Datenvolumen (der Ausgangs- und Zielsprache) trainiert wurde. Dies ist erst seit relativ kurzer Zeit möglich, da früher keine ausreichende Rechenleistung für „Big Data“ zur Verfügung stand. Es gab zwar auch vorher (etwa seit Anfang des Jahrtausends) schon statistische maschinelle Übersetzung (SMT), die auf der Häufigkeitsverteilung von Phrasen in den Trainingsdaten basierte. Diese Methode besteht – vereinfacht ausgedrückt – darin, auf der Basis der zweisprachigen Trainingsdaten den wahrscheinlichsten Satz in der Zielsprache zu ermitteln. Die neuronale Methode unterscheidet sich davon insofern, dass sie basierend auf künstlicher Intelligenz und Deep Learning die neuronale Vernetzung im Gehirn imitiert. Das bedeutet, dass die Zusammenhänge zwischen Ausgangs- und Zieltext von künstlichen neuronalen Netzen erfasst werden.
Professionelle Übersetzer werden immer häufiger gefragt, ob menschlich erstellte Übersetzungen (sog. „Humanübersetzungen“) überhaupt noch benötigt werden. Gleichzeitig stellen wir uns als Sprachdienstleister die Frage, ob wir maschinelle Übersetzung zu unserem eigenen Nutzen einsetzen können. Im Praxistest überzeugt uns die maschinelle Übersetzung allerdings längst nicht so sehr, wie man auf den ersten Blick erwarten könnte. Im Folgenden stellen wir die wichtigsten Herausforderungen bei der Nutzung maschineller Übersetzungstools vor.
Qualitätsprobleme
Die Qualität ist bei Weitem nicht so verlässlich, wie man aufgrund der guten – und teilweise sogar hervorragenden – Lesbarkeit der Übersetzung durch neuronale Tools vermuten würde. Auch wenn die Grammatik korrekt ist, werden beispielsweise manchmal Wörter oder ganze Satzteile ausgelassen, oder der Sinn wird verdreht. Das ist für Nutzer der maschinellen Übersetzung umso gefährlicher, je schlechter sie die Ausgangssprache beherrschen. Aber auch für Sprachexperten, die maschinenübersetzte Texte post-editieren (nachbearbeiten), ist das Risiko groß, Fehler zu übersehen. Daraus folgt: Je wichtiger die 100%-ige Richtigkeit eines Textes (etwa ein Beipackzettel für Medikamente oder eine Bedienungsanleitung) ist, desto riskanter ist maschinelle Übersetzung (MT), egal wie standardisiert die Formulierungen auch sein mögen. Dazu kommt, dass die Maschine Fehler im Ausgangstext nicht erkennt, egal wie unlogisch der Text dadurch wird. Die Maschine hat im Gegensatz zu einem menschlichen Übersetzer eben schlichtweg „keine Ahnung“, was sie da eigentlich übersetzt.
Wenn dann so etwas herauskommt wie „Die italienische Sängerin Andrea Bocelli schaffte es diese Woche auf Platz eins der Albumcharts“ oder „Die letzten 24 Stunden haben bestätigt, dass Theresa Mays Brexit Deal tot im Wasser ist“, mag das noch lustig sein. Wenn aber in einem Vertrag oder einer Vollmacht ein Halbsatz fehlt, kann das schwerwiegende juristische Folgen haben.
Datenschutz-Risiko
Bei den kostenlos im Internet verfügbaren Übersetzungstools werden alle eingespeisten Daten von den jeweiligen Anbietern auf deren Servern gespeichert und weiterverwendet . Somit dürfen in diesen Tools gemäß Datenschutz-Grundverordnung (DSGVO) niemals vertrauliche bzw. personenbezogene Daten Dritter eingegeben werden, da dies als Datenverarbeitung gemäß Art. 4 DSGVO[1] gilt. Das bedeutet zwangsläufig, dass man Texte in einer völlig fremden Sprache nicht einfach online maschinell übersetzen lassen darf, da man ja gar nicht weiß, ob der Text personenbezogene Daten enthält.
Dasselbe gilt für alle Texte, die mit Urheberrechtsschutz belegt sind. Gebe ich einen solchen Text ohne Zustimmung des Autors in Google Translate o. ä. ein, stelle ich den Text Dritten zur Verfügung und verletze somit das Urheberrecht. Die Tatsache, dass Google Translate „das Internet auf Texte durchsucht und sie einsammelt, um sie in einen riesigen Topf für statistisch basierte MT (dazu zählt auch die NMT) zu verwenden, verstößt gegen das Urheberrecht, denn sicherlich ist bei der Unmenge an Texten aus dem Internet nicht systematisch um eine Nutzungserlaubnis gebeten worden“.[2]
DeepL hat in seine Datenschutzerklärung zumindest einen expliziten Hinweis eingefügt: „Bitte beachten Sie, dass Sie unseren Übersetzungsservice nicht für Texte mit personenbezogenen Daten jeglicher Art nutzen dürfen.“[3] Bei Google Translate oder im Bing Microsoft Translator fehlt ein solcher Hinweis und es wird auch nicht darüber informiert, was mit den eingegebenen Texten bzw. den Übersetzungen geschieht. Es kann lediglich der allgemeine Servicevertrag aufgerufen werden, der für die Nutzung von Diensten des Anbieters gilt. Im Microsoft-Servicevertrag heißt es beispielsweise unter „Ihre Inhalte“: „Wenn Sie Ihre Inhalte mit anderen Personen teilen, stimmen Sie ausdrücklich zu, dass diese Personen berechtigt sind, Ihre Inhalte kostenlos und weltweit zu nutzen, zu speichern, aufzuzeichnen, zu vervielfältigen, zu versenden, zu übertragen, zu teilen, anzuzeigen und weiterzugeben […]. Wenn Sie anderen Personen diese Möglichkeit nicht einräumen möchten, geben Sie Ihre Inhalte nicht über die Dienste frei.“[4]
Arbeitsaufwand
Maschinelle Übersetzungen können durch eine Nachbearbeitung (sog. „Postediting“) durch menschliche Übersetzer verbessert werden. Je nach Anspruch an die Qualität des Zieltextes unterscheidet man zwischen „leichtem“ („light“) und „vollständigem“ („full“) Postediting. Bei der leichten Variante werden z. B. nur Sinnfehler sowie Grammatik und Rechtschreibung korrigiert, nicht aber der Stil oder seltsame Satzstellungen. Selbst diese Variante kann je nach Output der Maschine relativ aufwändig sein. Das vollständige Postediting, dessen Ergebnis sich dem einer von menschlichen Profis erstellen Übersetzung zumindest stark annähern sollte, ist noch wesentlich zeit- und kostenintensiver. Welche Fehlerarten genau zu korrigieren sind, muss im Vorfeld mit dem Kunden bzw. Nutzer der Übersetzung abgestimmt werden, denn insbesondere der Stil, aber auch die Verwendung eines bestimmten Fachvokabulars sind nicht für alle Textsorten (und Leser) gleich wichtig. Damit kann vollständiges Postediting aufwendiger und im Endeffekt teurer sein als eine (neue) Übersetzung durch einen qualifizierten Sprachdienstleister.
Es ist auch zu beachten, dass Postediting nicht als Revision (d. h. Korrekturlesen) durch einen zweiten Übersetzer gilt, wie es beim Vier-Augen-Prinzip nach der Norm ISO 17100 „Übersetzungsdienstleistungen und Qualitätsmanagement in Übersetzungsunternehmen“ vorgesehen ist. Die Revision folgt ggf. nach Abschluss des Postediting. Der Aufwand für die Nachbearbeitung einer maschinellen Übersetzung kann also erheblich sein und ist schwer vorauszusehen, da die Qualität von MT stark variiert. Sie hängt vom Fachgebiet ab und natürlich auch davon, wie umfangreich und mit welcher Datenqualität eine Maschine für das spezielle Thema und die benötigte Sprachkombination trainiert wurde. Die Sprachkombination hat ohnehin eine starke Auswirkung auf die Qualität einer maschinell angefertigten Übersetzung, da für seltener Sprachpaare nicht genügend Daten zur Verfügung stehen, um Maschinen umfassend zu trainieren.
Benötigte Expertise
Die Postediting-Norm DIN ISO 18587 verlangt, dass Posteditoren über einen Hochschulabschluss im Bereich Übersetzung bzw. „mit einen wesentlichen Anteil an Übersetzungsausbildung“ oder über einen anderen Hochschulabschluss und entsprechende Berufserfahrung verfügen müssen. Ohne Hochschulabschluss muss laut der ISO-Norm die „Berufserfahrung auf dem Gebiet des Übersetzens oder Posteditierens einer Zeitdauer von fünf Jahren Vollzeit entsprechen“. Weitere vorgesehene Kriterien sind u. a. technische, kulturelle und Sachgebietskompetenz sowie auch die Kompetenz bei Recherche, Informationsgewinnung und -verarbeitung. Außerdem müssen Posteditoren allgemeines Wissen über MT-Technologien und darüber, welche Arten von Fehlern bei MT-Systemen auftreten, besitzen.
Eine effektive Nachbearbeitung von maschinenübersetzten Texten sollte also keinesfalls von Laien durchgeführt werden, und auch umfangreiches Fachwissen auf dem Sachgebiet eines Textes alleine genügt nicht, um eine inhaltlich richtige und/oder qualitativ hochwertige Endfassung zu gewährleisten. Auch beim Einsatz von MT geht also nichts ohne hochausgebildete Übersetzungsexperten.
Fazit
Kostenlose Übersetzungstools bergen viele Risiken und können von professionellen Übersetzungsdienstleistern schon aufgrund des Datenschutzes, aber auch aus Qualitätsgründen nur sehr eingeschränkt genutzt werden. Sicherlich gibt es Texte und Situationen, in denen diese Tools für Privatpersonen hilfreich sind. Dazu zählen öffentlich zugängliche Texte wie beispielsweise Pressemeldungen oder Artikel im Internet, die jemand grundsätzlich verstehen möchte und bei denen nicht jedes Detail absolut richtig übersetzt sein muss. Oder Texte, die ansonsten gar nicht übersetzt würden, wie etwa touristische Informationen.
Nicht unerwähnt bleiben sollten lizenzpflichtige Lösungen für maschinelle Übersetzungen, die auf bestimmte Fachgebiete und Textsorten trainiert werden können. Diese sind vor allem bei großen Technikfirmen wie beispielsweise Siemens oder VW, aber auch bei den EU-Institutionen im Einsatz. Je standardisierter die Sprache im Ausgangstext ist, desto höher kann auch die Qualität sein – wenn die Maschine in riesigem Umfang mit korrekten und fachlich passenden Trainingsdaten gefüttert wurde. Solche Systeme sind jedoch für ein fachlich breit aufgestelltes Übersetzungsbüro mit deutlichem Schwerpunkt auf „frei“ zu übersetzenden Marketing- und Werbetexten wie die Peschel Communications GmbH derzeit nicht sinnvoll. Bei fachlich hoch anspruchsvollen und auf den einzelnen Kunden maßgeschneiderten Übersetzungen ist der menschliche Übersetzer der Kombination Maschinenübersetzung/Postediting in Bezug auf Zeitaufwand und Ergebnis deutlich überlegen. Wir verfolgen die Entwicklung der diversen Tools jedoch sehr aufmerksam und wollen uns dem technischen Fortschritt in diesem Bereich auf keinen Fall verschließen.
Kontakt
PESCHEL COMMUNICATIONS GmbH
[1] Quelle: https://dsgvo-gesetz.de/art-4-dsgvo/ (Zugriff am 25.09.2019)
[2] Quelle: Abraham de Wolf: Übersetzen mit Software, wer ist der Urheber? In: Jörg Porsiel (Hrsg.): Maschinelle Übersetzung, BDÜ Fachverlag, S. 61 f
[3] Quelle: https://www.deepl.com/privacy.html (Zugriff am 25.09.2019)
[4] Quelle: https://www.microsoft.com/de-de/servicesagreement/ (Zugriff am 25.09.2019)