Künstliche Intelligenz im Fremdsprachenunterricht
Wie KI-basierte Software Einzug in den Fremdsprachenunterricht hält
KI-basierte Technologie ist allgegenwärtig und auch aus dem Kontext des Fremdsprachenunterrichts kaum noch wegzudenken. Wir geben einen Einblick in das Feld des Natural Language Processing und zeigen Potentiale KI-basierter Technologien im Unterricht.
Von Tobias Brockhorst
Technologien, die auf künstlicher Intelligenz (KI) basieren, begegnen uns sehr häufig im Alltag. Von personalisierten Suchergebnissen in Internet-Suchmaschinen und Werbeanzeigen in sozialen Medien, über digitale Sprachassistenten und Smart-Home-Geräte, bis hin zur Gesichtserkennung zum Entsperren des Smartphones, haben sich KI-basierte Technologien auf viele Lebensbereiche ausgebreitet. Auch im Fremdsprachunterricht erfreuen sie sich seit geraumer Zeit wachsender Beliebtheit. Hier geht es um zwei Teilbereiche des Natural Language Processing: die maschinelle Übersetzung und die maschinelle Erzeugung von Texten.
Menschliche und maschinelle Übersetzungen lassen sich kaum voneinander unterscheiden
Übersetzungssoftwares sind im Fremdsprachunterricht mittlerweile fest etabliert. Bei Verständnisschwierigkeiten greifen Lernende oftmals sofort intuitiv zum Smartphone, um die Bedeutung von ihnen unbekannten Wörtern oder Sätzen erschließen zu können. Im Vergleich zu herkömmlichen, schweren Wörterbüchern, hat man das Smartphone in der Regel ohnehin jederzeit griffbereit, und das Nachschlagen geht obendrein deutlich schneller. Auch bei der Produktion von zunächst in der Muttersprache verfassten Texten sind die Softwares sehr beliebt.Während vor einigen Jahren maschinell übersetzte Texte von den Leser*innen sofort als solche enttarnt werden konnten, hat die Forschung auf dem Feld der Übersetzungstechnologie im letzten Jahrzehnt massive Fortschritte erzielen können, sodass es heute nahezu unmöglich ist zu erkennen, ob ein Mensch oder ein Computer eine Übersetzung angefertigt hat. Im Unterricht fällt dies Lehrkräften natürlich dennoch häufig auf, z.B. wenn ein*e Lernende*r im Unterricht nur mittelmäßig gute Ergebnisse im Bereich der produktiven Schreibkompetenz vorweisen kann, aber jeder Text, der von dem bzw. der Lernenden als Hausaufgabe angefertigt wurde, grammatikalisch und orthographisch einwandfrei ist.
Ein Beispiel für den rasanten Fortschritt KI-basierter Übersetzungssoftware, welche täglich von über einer Million Menschen genutzt wird, ist das 2017 von einem Kölner Unternehmen entwickelte DeepL. Die Übersetzungen in mittlerweile 28 Sprachen werden anhand statistischer Daten angefertigt, welche die Wahrscheinlichkeit von bestimmten Wörtern in bestimmten Kontexten beschreiben. Dabei werden mehrere Milliarden Parameter berücksichtigt.
Das Unternehmen trifft regelmäßig Maßnahmen, um die hohe Qualität der generierten Übersetzungen zu gewährleisten. So wurde zum Beispiel im Jahr 2017 eine Blindstudie durchgeführt, bei der eine Gruppe professioneller Übersetzer mit 100 Sätzen konfrontiert wurde, die jeweils von DeepL und von drei konkurrierenden Übersetzungssoftwares großer Tech-Unternehmen übersetzt wurden. Dabei schnitten die von DeepL erzeugten Texte drei Mal so gut ab wie die Ausgabetexte einer bekannten Suchmaschinen-Übersetzungssoftware, da die menschlichen Übersetzer sie als deutlich natürlicher klingend empfanden.
Vom DeepL-Übersetzer angefertigte Beispielübersetzung | © DeepL
Die Hausaufgaben von einer Software verfassen lassen
Neben der maschinellen Übersetzung von Texten gibt es einen weiteren Teilbereich im Feld des Natural Language Processing, welcher in der jüngeren Vergangenheit große technische Fortschritte erzielen konnte – die maschinelle Erzeugung von Texten. Eine Organisation, welche in den letzten Jahren in diesem Kontext immer wieder Schlagzeilen gemacht hat, ist OpenAI. Die Organisation mit Sitz in San Francisco, welche im Jahr 2015 gegründet wurde, beschäftigt sich mit der Erforschung von künstlichen Intelligenzen und entwickelt unter anderem Algorithmen, welche Texte verfassen und vervollständigen können.Der neuste dieser Algorithmen, welcher den Namen Generative Pretrained Transformer 3 (GPT-3) trägt, wurde erstmals im Jahr 2020 in Form einer wissenschaftlichen Publikation vorgestellt. Das Sprachmodell ist aktuell das größte seiner Art, wurde anhand von 45 TB an Daten trainiert und basiert auf einem neuronalen Netz mit 175 Milliarden Parametern. Von herkömmlichen Textgeneratoren unterscheidet sich die Software in zweierlei Hinsicht – zum einen werden keine vorgefertigten Textblöcke verwendet, zum anderen ist der Algorithmus nicht auf ein bestimmtes Themen- oder Anwendungsgebiet spezialisiert, sondern liefert passende Sätze für nahezu jeden Bereich. Wie auch DeepL, beruht das neuronale Netzwerk von GPT-3 auf einem statistischen Modell, welches die kontextabhängige Wahrscheinlichkeit von Wörtern und Sätzen beschreibt.
Gibt man der Software einen Input wie “Schreibe eine Geschichte über einen Jungen namens Max, der sich auf eine abenteuerliche Reise um die Welt” begibt, dann beginnt der GPT-3 Algorithmus genau dies zu tun und verfasst eine entsprechende Erzählung. Der Algorithmus, der auf verschiedenen Sprachen nutzbar ist, verfügt allerdings über kein eigenes Weltwissen, sondern ist lediglich sehr gut darin vorherzusagen, wie das nächste Wort bzw. der nächste Satz aussehen könnte. So finden schließlich nach und nach auch Textgeneratoren ihren Einzug in den Fremdsprachenunterricht, da es für eine*n Teilnehmende*n natürlich viel einfacher ist, einen Aufsatz oder einen Dialog zu einem bestimmten Thema von einer Software generieren zu lassen, als ihn selbst zu verfassen.
Vom OpenAI GPT-3 Playground angefertigte Beispielgeschichte | © OpenAI
Mit dem Nutzen einer Software wächst auch ihr Missbrauchspotenzial
Neben Anwendungsbeispielen wie dem Verfassen von Texten im Fremdsprachunterricht können Textgeneratoren auch zu moralisch fragwürdigen oder kriminellen Zwecken verwendet werden. So lassen sich zum Beispiel ohne große Mühe einzigartige Spam-Nachrichten und Fake News erzeugen. Zudem können akademische Artikel mit Leichtigkeit gefälscht werden, was potentiell zur Verbreitung von Desinformation beitragen kann. Auch maschinelle Übersetzungssoftware lässt sich hervorragend für das Verfassen von Spam-Nachrichten sowie im Kontext verschiedener Formen des Online-Betrugs nutzen, wie zum Beispiel beim sogenannten Gewinnspiel-Betrug oder dem sogenannten Romance Scamming.Ein weiteres Risiko bei der Nutzung von KI-basierter Übersetzungs- und Texterzeugungssoftware ist die Ausgabe von problematischen Inhalten oder vulgärer Sprache. Kommen in den Trainingsdaten der Software Kraftausdrücke oder rassistische, sexistische oder religiöse Stereotypen vor, so besteht stets die Gefahr, dass diese auch im generierten Output genutzt oder wiedergegeben werden.
Mit dem Nutzen einer Software wächst auch ihr Missbrauchspotenzial. Auch Endnutzer*innen sollten sich ihrer Verantwortung bewusst sein, wie sie die Software verwenden und was mit den Outputs passiert.
Im Unterricht lassen sich die Technologien sinnvoll einsetzen
Wie können Lehrkräfte KI-basierte Softwares auf konstruktive Weise einsetzen und im Unterricht für einen verantwortungsvollen Umgang mit diesen Technologien sensibilisieren? Eine Möglichkeit ist, mit maschinell übersetzten und generierten Texten zu arbeiten, um das metasprachliche Bewusstsein der Lernenden zu stärken und ihnen die Grenzen der Software aufzuzeigen.Bei der maschinellen Übersetzung selbst aus dem Englischen oder Spanischen haben die Softwares mit Genera oder auch ausgelassenen Personalpronomen zu kämpfen – es können nach wie vor Fehler auftreten. Mit der Übersetzung von Metaphern und Allegorien, bei denen der Wortlaut stark vom eigentlichen Sinn der Aussage abweicht, haben Übersetzungssoftwares ebenfalls häufig Probleme. Die Softwares treffen auch nicht immer den richtigen Ton, was Kontext, Adressat*innen und sprachliches Register betrifft. Die Lernenden die semantischen, grammatikalischen und stilistischen Fehler und Ungereimtheiten in einem maschinell übersetzten Text korrigieren zu lassen, kann zu dieser Sensibilisierung beitragen.
Auch maschinelle Textgeneratoren lassen sich gut in den Fremdsprachenunterricht einbinden. Dadurch, dass die Textgeneratoren über kein eigenes Weltwissen verfügen, sondern Wortabfolgen anhand von statistischen Daten erzeugen, entsprechen die Outputs nicht immer dem, was eigentlich von der Software erwartet wurde. So ist es für die Textgeneratoren zwar kein Problem, eine Fantasiegeschichte mit einer bestimmten Handlung zu schreiben, allerdings tun sie sich beim Verfassen von Sachtexten zu spezialisierten Fachthemen deutlich schwerer. Auch von den stilistischen Problemen, die im Kontext der maschinellen Übersetzung erwähnt wurden, sind die Textgeneratoren betroffen. Im Unterricht ließe sich also mit maschinell erzeugten Texten arbeiten, indem man die Lernenden dazu auffordert, diese in verschiedener Hinsicht zu überarbeiten – sei es, um die Texte an ein bestimmtes Register bzw. einen bestimmten Adressaten anzupassen oder um bestimmte inhaltliche Anforderungen beim Verfassen eines Sachtexts zu erfüllen.
Für Lehrkräfte besteht außerdem die Möglichkeit, die Textgeneratoren im Rahmen der Unterrichtsvorbereitung einzusetzen, zum Beispiel für die Einführung von neuem Wortschatz. So kann man dem Algorithmus zum Beispiel ein bestimmtes Thema vorgeben und einige Wörter benennen, die in einem zu erzeugenden Text enthalten sein sollen, und der Algorithmus setzt dies um.
Ein vom OpenAI GPT-3 Playground zum Zwecke der Wortschatzeinführung angefertigter Beispieltext | © OpenAI Die Technologien bergen neben dem großen Nutzen auch großes Missbrauchspotenzial. Lehrkräfte können im Unterricht Strategien entwickeln, die einen verantwortlichen und konstruktiven Umgang mit KI-basierter Software ermöglichen.
Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence. Abgerufen am 5. Juli 2022, von https://slator.com/deepl-got-machine-translation-plans-make-money/.
Raveling, Jann (2022): Was ist ein neuronales Netz?. Wirtschaftsförderung Bremen GmbH. Abgerufen am 5. Juli 2022, von https://www.wfb-bremen.de/de/page/stories
/digitalisierung-industrie40/was-ist-ein-neuronales-netz.
Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Abgerufen am 5. Juli 2022, von https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.
Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do?. Medium. Abgerufen am 5. Juli 2022, von https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.
Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Abgerufen am 5. Juli 2022, von https://www.dw.com/en/d
eepl-cologne-based-startup-outperforms-google-translate/a-46581948.