Digitale Übersetzungs-Tools
Kann Künstliche Intelligenz eine Hilfe bei Übersetzungen sein?

AI unterstützt menschliche Übersetzer*innen | Philippos Vassiliades | CC-BY-SA

Inwiefern unterscheiden sich literarische Übersetzungen von anderen Formen der Übersetzung? Vereinfacht gesagt liegt das Augenmerk bei Sachtext-Übersetzungen, wie etwa im kommerziellen, legalen oder medizinischen Bereich, auf der Bedeutung eines Textes, bei Literaturübersetzungen hingegen fast ebenso stark auf dem Stil des Textes.

Von Roy Youdale

Bei literarischem Stil geht es nicht nur darum, was gesagt wird, sondern auch, wie es gesagt wird. Dem Literaturkritiker Terry Eagleton zufolge ist literarisches Schreiben "die Art von Schreiben, bei der der Inhalt sich nicht von der Sprache, durch die er dargestellt wird, trennen lässt." So haben zum Beispiel die beiden untenstehenden Sätze prinzipiell die gleiche Bedeutung, wie diese ausgedrückt wird, und somit auf die Leser*innen wirkt, ist jedoch sehr unterschiedlich.

"She picked a purple bluebell from the ground." (Original: „Sie pflückte eine violette Glockenblume aus der Erde.“)
"Purple was the colour of that sign of spring she plucked from the earth, the bluebell." (Original: „Violett war die Farbe dieses von ihr aus der Erde gepflückten Frühlingsboten, der Glockenblume.“)

Satz 1 wie Satz 2 zu übersetzen, würde den Originaltext völlig entstellen.

Ein/e literarische Übersetzer*in muss daher sowohl Stil als auch Inhalt berücksichtigen und somit sprachliche Entscheidungen treffen und man hört oft, dass zwei Übersetzer*innen den gleichen Text nie absolut gleich übersetzen würden. Wie also gehen literarische Übersetzer*innen dabei vor, die Bedeutung eines Textes als auch dessen Wirkung auf die Leser*innen (so wie sie diese einschätzen) zu rekonstruieren? Prinzipiell, indem sie nach Sprachmustern in der Vorlage suchen und versuchen, diese in einer anderen Sprache nachzubilden, ein Prozess, den ich „creative reverse engineering„“ (kreative Umkehrtechnik) nenne.

KI und die Erkennung sprachlcher Muster

Menschen sind sowohl Gewohnheitswesen als auch Individuen. So wie wir stets auf eine besondere Art gehen, anders als alle anderen Menschen und einmalige Fingerabdrücke haben, so benutzen wir beim Schreiben sowohl bewusste als auch unbewusste Ausdrucksmuster. Durch sie sind wir als Autor*innen identifizierbar und sie spielen eine große Rolle bei der Übersetzung unserer Schriften in eine andere Sprache. Einige dieser sprachlichen Muster sind leicht erkennbar. Wenn z.B. ein/e Autor*in oft Umgangssprache benutzt oder hochgestochene Worte wie „discombobulated“ benutzt, ist das leicht zu bemerken. Es gibt aber wichtige Aspekte literarischen Stils, die nicht so leicht zu erkennen sind, die Leseerfahrung jedoch beeinflussen. Dazu gehören z.B. die Satzlänge und die Benutzung von Satzzeichen und Wiederholungen. Wenn wir uns der Präsenz und Wichtigkeit dieser sprachlichen Muster nicht bewusst sind, können wir auch nicht versuchen, sie in einer literarischen Übersetzung nachzubilden.

Was wäre, wenn künstliche Intelligenz (KI) Übersetzer*innen dabei helfen könnte, die Sprachmuster von Autor*innen zu identifizieren? Die gute Nachricht ist, dass sie es kann und dabei immer differenzierter wird. Software wie etwa Sketch Engine kann, mit ein paar Mausklicks, alle Worte im Text ihrer Häufigkeit nach auflisten; sie kann die Satzlänge analysieren (sowohl die gesamte Durchschnittslänge als auch eine Aufschlüsselung nach Anzahl der Sätze, die aus 2, 3, 4 etc. Worten bestehen); sie kann n-grams (wiederholte Sequenzen von 2, 3, 4, etc. Worten) nach Länge und Häufigkeitauflisten; und sie kann die Wortschatzbreite analysieren (die Anzahl verschiedener Arten von Worten im Verhältnis zu allen benutzten Worten), und noch vieles mehr. Das Textvisualisierungs-Programm Voyant Tools kann unterschiedliche linguistische Merkmale eines Textes visuell darstellen, es zeigt Wortfrequenz als word cloud und die Frequenz einzelner Wörter und Phrasen über einen Text hinweg als Graphen. Das Textanalyseprogramm Coh-Metrix spuckt mit einem Klick mehr als 200 statistische Maße zu Sprachnutzung und Lesbarkeit aus.

Eine Vielzahl von Sprachmustern in einem zu übersetzenden Originaltext zu finden ist die eine Sache, wie aber kann der/ die Übersetzer*in diese dann in einer anderen Sprache rekonstruieren? Was, wenn KI mehr könnte, als nur Sprachmuster auf Anfrage der Übersetzer*innen zu analysieren, was wenn sie auch selbst übersetzen könnte? Wie jede/r Nutzer*in von Google Translate weiß, ist die Antwort, dass KI das sehr wohl kann und zwar auf verschiedene Arten. Ein weiterer Artikel in diesem Dossier, „Artificial Intelligence and Literary Translation“, befasst sich damit, wie voll automatische neural machine translation (NMT) in den letzten Jahren bei Literaturübersetzungen eingesetzt wurde. Der Artikel und die in ihm zitierten Forschungsarbeiten legen nahe, dass - obschon eine vollautomatische Literaturübersetzung noch einen weiten Weg vor sich hat, bevor sie der Qualität menschlicher Übersetzungen entsprechen könnte -- ihre Nutzung als eine Art erster Entwurf, der dann von einem/r Übersetzer*in redigiert (im Jargon, „post-edited“) wird, mittlerweile realistisch ist. Es gibt noch eine weitere Methode, wie KI in literarischen Übersetzungenzum Einsatz kommt: indem sie Übersetzungsvorschläge in Echtzeit anzeigt, während des Tippens.

KI und das Zusammentreffen verschiedener Übersetzungstechniken

Um das zu verstehen, muss man zunächst erklären, wie „computer-aided translation“ (computerunterstütze Übersetzung) (CAT) - Software funktioniert; fast alle Sachtextübersetzer*innen und einige Literaturübersetzer*innen benutzen sie. CAT-Tools (oder CAT-Werkzeuge), wie diese Softwareprogramme genannt werden, wurden in den 1960er und 70er Jahren entwickelt und sind seit den 1980er Jahren handelsüblich. Die ihnen zugrundeliegende Technologie heißt Translation Memory (TM). Dahinter steckt die Idee, dass die Übersetzerin niemals den gleichen Satz zweimal übersetzen muss, wenn er mehrmals im Text vorkommt. Während die Übersetzerin das Dokument bearbeitet, speichert das Programm automatisch alles, was schon übersetzt wurde; taucht ein schon übersetzter Satz wieder auf, erkennt ihn das Programm und bietet der Übersetzerin die Übersetzung an, die sie schon vorgenommen hat, spart ihr also Zeit und Aufwand und hilft gleichzeitig dabei, die Einheitlichkeit der Übersetzung zu wahren, was oft sehr wichtig ist. Es ist erwiesen, dass CAT-Tools sich am besten für Texte eignen, die repetitiv, sprachlich einheitlich und in relativ kurzen Sätzen verfasst wurden.

Die Benutzeroberfläche der CAT-Tools zeigt den zu übersetzenden Text normalerweise in Form einer Tabelle an, wo er in Sätze (oder „Segmente“) heruntergebrochen ist, die jeweils eine Zelle in der Tabelle einnehmen. Dieser sogenannte „Quellen“-Text erscheint auf der linken Seite der Tabelle, die rechte Seite bietet leere Zellen, in die die Übersetzung, oder der „Ziel“-Text, getippt wird, wie man hier sehen kann:

Smartcat Übersetzungsoberfläche | Roy Youdale | Smartcat | CC-BY-SA

Bei Smartcat, einem kostenfreien online CAT-Tool, erscheint rechts neben den auf dem Bildschirmfoto sichtbaren Spalten ein Bereich, in dem automatische TM Vorschläge erscheinen, die der/die Übersetzer*in annehmen oder ablehnen kann. Bei den frühen CAT Tools kamen alle Vorschläge ausschließlich aus der Datenbank der schon übersetzten Textsegmente des vorliegenden Textes. Seitdem hat die Bandbreite der Quellen für Übersetzungsvorschläge in CAT-Tools merklich zugenommen. Mittlerweile kann man ein TM aus einer oder mehreren ähnlichen Übersetzungen in ein CAT-Tool importieren; man kann auf fachbezogene Glossare (oder „term bases“) zugreifen oder sie erstellen; und die TMs durchsuchen, um zu sehen, wie einzelne Worte und Phrasen und auch ganze Sätze schon übersetzt wurden. Bahnbrechend war dabei der Einbezug von Maschinenübersetzung (MT) in die CAT-Tools.

MT benutzt einen Computer, um Worte in einem Quelltext zu suchen und mit riesigen Datenbanken (Milliarden von Worten) von schon in die Zielsprache übersetzten Textenzu vergleichen. Zusätzlich zur Übersetzung einzelner Worte sucht der Computer nach entsprechenden Abfolgen von Worten oder „strings“ (Zeichenfolgen), ein Prozess, der sich „String-Matching“ nennt. Mit den Fortschritten in der neuesten Methode der Maschinenübersetzung, NMT, können Computer mittlerweile nicht nur direkte String-Matches finden, sondern auch den Kontext jedes Satzes anhand der ihn umgebenden Sätze absuchen. Das hilft beim Umgang mit Zweideutigkeiten, die sich etwa bei Worten wie „right“ ergeben können, ein Wort, das eine Richtung angeben, einen Anspruch signalisieren, aber auch „korrekt“ oder „fair“ bedeuten kann. Die Fähigkeit der CAT-Tools, auf MT-Datenbanken, TMs und auch Begriffsbanken für Übersetzungsvorschläge zugreifen zu können, zeigt KI in voller Aktion.

Der Einbezug von MT in CAT-Tools

Die Übersetzungsvorschläge, die sich aus den TMs und den MT-Datenbanken ergeben, sind hauptsächlich auf zwei Arten in die CAT-Tools integriert. Bei der einen schlägt die Software eine Übersetzung für das gesamte Segment vor, das gerade in Bearbeitung ist, also für einen ganzen Satz. Die Übersetzerin kann den Vorschlag annehmen, ablehnen oder redigieren. Diese Herangehensweise wird oft „post-editing“, also Nachredigieren genannt. Bei der anderen Methode kommt eine „interactive machine translation“ (ITM: interaktive maschinelle Übersetzung) zum Zug. Hierbei greift die Software auf die selben Quellen zurück, zeigt die Resultate aber in Echtzeit an, in Form von automatischen Ergänzungen genau wie bei der Texterkennung. Die Übersetzungswissenschaftlerinnen Anna Zaretskaya, Gloria Corpas Pastor and Miriam Seghiri erklären dazu: „Mit jedem Buchstaben, der getippt wird, werden die Vorschläge berechnet und die Nutzer*innen können sie durch eine bestimmte Taste annehmen oder durch Weitertippen ablehnen. Dadurch überarbeitet das System die Vorschläge ununterbrochen während die Nutzerin tippt,“ – die Software „lernt“ also im Prozess.

So sieht das bei einem der neueren CAT-Tools, Lilt, aus:

Übersetzungsvorschlag in Echtzeit in Lilt | Roy Youdale | Smartcat | CC-BY-SA

Dadurch, dass das System den Übersetzer*innen Lösungen anbietet, die ihnen vielleicht von selbst nicht eingefallen wären, kann es sich positiv auf ihre Kreativität auswirken. Andererseits fühlen sich manche Übersetzer*innen dadurch eher unter Druck gesetzt, die vorgeschlagene automatische Vervollständigung anzunehmen, was ihre Kreativität wiederum beschränkt.

Literarische Übersetzer*innen und CAT-Tools

Die meisten literarischen Übersetzer*innen benutzen keine CAT Tools beim Übersetzen. Ihrer Meinung nach lassen sich diese Werkzeuge nicht auf literarische Sprache anwenden und viele arbeiten auch ungern mit einer Bedieneroberfläche, bei der der Text in alleinstehende Sätze aufgeteilt wird und ihnen so den Textzusammenhang eines Absatzes, einer Seite oder eines Kapitels nimmt, welcher im Umgang mit der Narrative oft eine wichtige Rolle spielt. Oft lehnen sie auch die MT für Literatur ab, verweisen auf die schlechte Qualität der Resultate bei Programmen wie Google Translate und meinen, dass Übersetzer*innen viel mehr wissen und verstehen müssen als nur die Bedeutung der Worte auf der Seite. Nämlich auch kulturelle, politische und historische Bezüge, Redewendungen und alles, was das sogenannte Erfahrungswissen ausmacht.

Anscheinend ändert sich diese Haltung jedoch und besonders jüngere Literaturübersetzer*innen sind eher gewillt, mit CAT-Tools zu experimentieren. Obwohl richtig ist, dass bei literarischen Übersetzungen, wo Wiederholungen selten vorkommen, das Nichtwiederholenmüssen von ganzen Sätzen kaum eine Rolle spielt, lassen sich andere Funktionen der CAT-Tools grundsätzlich bei allen Arten von Übersetzungen einsetzen. Dazu gehört die Möglichkeit:

die zuletzt bearbeitete Stelle nach einer Pause leicht wieder finden zu können, wodurch die Wahrscheinlichkeit, einen Satz zu übersehen – was überraschend leicht passiert – vermindert ist
frühere Versionen von jedem fertigen Segment einsehen zu können, sodass die letzte Version nachvollzogen und falls notwendig überarbeitet werden kann
die Übersetzung durchsuchen zu können, um zu sehen, wie man ein bestimmtes Wort oder eine Phrase vorher übersetzt hat
eine Übersetzung in unterschiedlichen Formaten zu exportieren, wie etwa einer satzjustierten Tabelle oder einem gewöhnlichen Word Dokument.

Fazit

[Eine Definition von künstlicher Intelligenz lautet:] Die Theorie und Entwicklung von Computersystemen, die Aufgaben ausführen können, die normalerweise menschlicher Intelligenz bedürfen, wie etwa visuelle Wahrnehmung, Spracherkennung, Entscheidungsfindung und Übersetzung zwischen Sprachen.

Oxford Dictionary

Obwohl ein Computer (noch) keine Wortspiele machen kann und auch keine Vorstellung von Sprachebenen – den Umgangston und dem Grad an Förmlichkeit – hat, ist er sehr gut im Zählen und Kategorisieren von Wörtern und in umfassenden Suchläufen nach String Matches. Er kann literarische Übersetzer*innen bei ihrer Arbeit sowohl halb- als auch vollautomatisch unterstützen. Wo, wann und wie KI und Computer in literarischer Übersetzung eingesetzt werden, ist ein noch relativ unerforschter Bereich unter dem vorläufigen Namen CALT („computer-aided literary translation“ oder computerunterstützte literarische Übersetzung), der sich mit dem prekären und ständig schwankenden Gleichgewicht zwischen Mensch und Maschine befasst.
Es scheint angebracht, über den momentanen Stand dieses Gleichgewichts zu reflektieren.

Begriffserklärung:

Quellen:

Boase-Beier, J. (2010) Stylistic Approaches to Translation. 3rd edn. London and New York: Routledge.

Chan, S.-W. (2015) ‘Computer-aided translation: major concepts’, in Chan, S.-W. (ed.) The Routledge Encyclopedia of Translation Technology. London and New York: Routledge, pp. 32–67.

Doherty, S. (2015) ‘The Impact of Translation Technologies on the Process and Product of Translation’, International Journal of Communication, 9 (February), pp. 1–23. doi: 10.1300/J009v26n03_04.

Eagleton, T. (2014) How to Read Literature. New Haven and London: Yale University Press.

Garcia, I. (2015) ‘Computer-aided translation: systems’, in Chan, S.-W. (ed.) The Routledge Encyclopedia of Translation Technology. London and New York: Routledge, pp. 68–87.

Lombardino, R. (2014) Why I Use A CAT Tool To Translate Books, eWordNews.

Melby, A. and Wright, S. (2015) ‘Translation Memory’, in Chan, S.-W. (ed.) The Routledge Encyclopedia of Translation Technology. London and New York: Routledge, pp. 662–677.

O’Hagan, M. (ed.) (2020) The Routledge Handbook of Translation and Technology. Abingdon and New York: Routledge. doi: 10.4324/9781315311258.

Prachi, K. ‘An Introduction to N-grams: What Are They and Why Do We Need Them?’

Rothwell, A. and Youdale, R. (forthcoming) ‘Computer-Assisted Translation (CAT) tools, translation memory and literary translation’, in Deane-Cox, S. and Spiessens, A. (eds.) The Routledge Handbook of Translation and Memory. London and New York: Routledge.

Ruffo, P. (2018) ‘Human-Computer Interaction in Translation : Literary Translators on Technology and Their Roles’, in Proceedings of the 40th Conference Translating and the Computer. London: AsLing, pp. 127–131.

Schiaffino, R. (2016) CAT tools and translation style, About Translation. Available at: http://www.aboutranslation.com/2016/04/cat-tools-and-translation-style.html.

Slessor, S. (2020) ‘Tenacious technophobes or nascent technophiles? A survey of the technological practices and needs of literary translators’, Perspectives. Taylor & Francis, 28 (2), pp. 238–252. doi: 10.1080/0907676x.2019.1645189.

Wasaty.pl (2019) ‘Literary translations with CAT tools’. October 20.

Youdale, R. (2020) Using computers in the translation of literary style: challenges and opportunities. London & New York: Routledge.

Zaretskaya, A., Pastor, G. and Seghiri, M. (2015) ‘Integration of machine translation in CAT tools: State of the art, evaluation and user attitudes’, SKASE Journal of Translation and Interpretation, 8 (1), pp. 76–88.

Digitale Übersetzungs-Tools Kann Künstliche Intelligenz eine Hilfe bei Übersetzungen sein?