Artificiële intelligentie in het vreemdetalenonderwijs
Hoe op ai-gebaseerde software zijn intrede doet in het vreemdetalenonderwijs

Muurvormige binaire codes vormen transmissielijnen van pulsen, Digitale informatie naar analogie van een zenuwcel
Kunstmatig neuraal netwerk (symboolafbeelding) | © Adobe Stock

AI-gebaseerde technologie is alomtegenwoordig en is niet meer weg te denken uit het vreemdetalenonderwijs. We geven een inzicht in het gebied van Natural Language Processing en tonen het potentieel van AI-gebaseerde technologieën in de klas. 

Von Tobias Brockhorst

Technologieën gebaseerd op kunstmatige intelligentie (AI) zijn heel gewoon in ons dagelijks leven. Van gepersonaliseerde zoekresultaten in internetzoekmachines en advertenties in sociale media, tot digitale spraakassistenten en slimme thuisapparaten, tot gezichtsherkenning om smartphones te ontgrendelen: AI-gebaseerde technologieën hebben zich verspreid over vele gebieden van het leven. Ze winnen ook al enige tijd aan populariteit in het vreemdetalenonderwijs. Hier houden we ons bezig met twee deelgebieden van Natural Language Processing: automatische vertaling en automatische tekstgeneratie. 

Natural Language Processing, dus natuurlijke taalverwerking is een discipline die wordt gedeeld door linguïstiek, computerwetenschap en AI-onderzoek. Het doel is het "begrijpen" van gesproken taal of teksten door computers, zodat ze bijvoorbeeld kunnen worden gebruikt voor het evalueren en genereren van teksten, voor automatische vertaling en voor spraakherkenning. Om dit begrip mogelijk te maken, zijn algoritmen nodig die patronen kunnen vinden en herkennen in een grote hoeveelheid ongestructureerde gegevens - zogenaamde neurale netwerken. 
 

MENSELIJKE EN AUTOMATISCHE VERTALINGEN ZIJN BIJNA NIET VAN ELKAAR TE ONDERSCHEIDEN 

Vertaalsoftware is nu een vaste waarde in het vreemdetalenonderwijs. Als leerlingen moeite hebben met het begrijpen van een tekst, grijpen ze vaak intuïtief naar hun smartphone om de betekenis te achterhalen van woorden of zinnen die ze niet kennen. Vergeleken met conventionele, zware woordenboeken is de smartphone meestal toch altijd bij de hand en gaat het opzoeken van woorden veel sneller. De software is ook erg populair voor het maken van teksten die eerst in de moedertaal worden geschreven. 

Terwijl machine vertaalde teksten een paar jaar geleden onmiddellijk als zodanig herkend konden worden door de lezer, heeft onderzoek op het gebied van vertaaltechnologie de afgelopen tien jaar enorme vooruitgang geboekt, zodat het tegenwoordig bijna onmogelijk is om te zien of een vertaling door een mens of een computer is gemaakt. Nochtans merken leerkrachten dit natuurlijk vaak in de klas, bijvoorbeeld wanneer een leerling slechts middelmatige resultaten heeft op het gebied van productieve schrijfvaardigheid, maar elke tekst die de leerling als huiswerk heeft gemaakt grammaticaal en orthografisch foutloos is. 

Een voorbeeld van de snelle vooruitgang van op AI gebaseerde vertaalsoftware, die dagelijks door meer dan een miljoen mensen wordt gebruikt, is DeepL, in 2017 ontwikkeld door een bedrijf uit Keulen. De vertalingen in inmiddels 28 talen worden gemaakt aan de hand van statistische gegevens die de waarschijnlijkheid van bepaalde woorden in bepaalde contexten beschrijven. Er wordt rekening gehouden met meerdere miljarden parameters. 

Het bedrijf neemt regelmatig maatregelen om de hoge kwaliteit van de gegenereerde vertalingen te waarborgen. In 2017 werd bijvoorbeeld een blind onderzoek uitgevoerd waarbij een groep professionele vertalers werd geconfronteerd met 100 zinnen die elk werden vertaald door DeepL en door drie concurrerende vertaalsoftwarepakketten van grote techbedrijven. De door DeepL gegenereerde teksten presteerden drie keer beter dan de uitgangsteksten van een bekende zoekmachinevertaalsoftware, omdat de menselijke vertalers vonden dat ze veel natuurlijker klonken. 

Vertaling van het Engels naar het Duits met synoniemfunctie voor woorden en zinnen.
Voorbeeldvertaling opgesteld door de DeepL vertaler | © DeepL

HUISWERK LATEN SCHRIJVEN DOOR SOFTWARE 

Naast het machinaal vertalen van teksten is er nog een ander deelgebied van Natural Language Processing dat in het recente verleden grote technische vooruitgang heeft geboekt: het machinaal genereren van teksten. Een organisatie die in dit verband de afgelopen jaren herhaaldelijk het nieuws heeft gehaald, is OpenAI. De in San Francisco gevestigde organisatie, die in 2015 werd opgericht, houdt zich bezig met onderzoek naar kunstmatige intelligentie en ontwikkelt onder andere algoritmen die teksten kunnen samenstellen en aanvullen. 

Het nieuwste van deze algoritmen, dat Generative Pretrained Transformer 3 (GPT-3) heet, werd in 2020 voor het eerst gepresenteerd in de vorm van een wetenschappelijke publicatie. Het taalmodel is momenteel het grootste in zijn soort, werd getraind met behulp van 45 TB aan gegevens en is gebaseerd op een neuraal netwerk met 175 miljard parameters. De software verschilt in twee opzichten van conventionele tekstgeneratoren - enerzijds worden er geen geprefabriceerde tekstblokken gebruikt en anderzijds is het algoritme niet gespecialiseerd in een specifiek onderwerp of toepassingsgebied, maar levert het geschikte zinnen voor vrijwel elk gebied. Net als bij DeepL is het neurale netwerk van GPT-3 gebaseerd op een statistisch model dat de contextafhankelijke waarschijnlijkheid van woorden en zinnen beschrijft. 

Als je de software een input geeft als "Schrijf een verhaal over een jongen genaamd Max die op een avontuurlijke reis rond de wereld gaat", begint het GPT-3 algoritme precies dat te doen en schrijft het een bijbehorend verhaal. Het algoritme, dat voor verschillende talen kan worden gebruikt, heeft zelf echter geen kennis van de wereld, maar kan alleen heel goed voorspellen hoe het volgende woord of de volgende zin eruit zou kunnen zien. Op deze manier vinden tekstgeneratoren geleidelijk hun weg naar het vreemdetalenonderwijs, omdat het voor een deelnemer natuurlijk veel gemakkelijker is om een essay of dialoog over een bepaald onderwerp door software te laten genereren dan om het zelf te schrijven. 

Machinegegenereerd verhaal over een jongen die aan een (avontuurlijke) reis rond de wereld begint
Voorbeeldverhaal gemaakt door de OpenAI GPT-3 Playground | © OpenAI

NAARMATE HET GEBRUIK VAN SOFTWARE TOENEEMT, NEEMT OOK DE KANS OP MISBRUIK TOE 

Naast voorbeelden van gebruik zoals het samenstellen van teksten in lessen vreemde talen, kunnen tekstgeneratoren ook worden gebruikt voor moreel twijfelachtige of criminele doeleinden. Unieke spamberichten en nepnieuws kunnen bijvoorbeeld zonder veel moeite worden gegenereerd. Bovendien kunnen academische artikelen met gemak vervalst worden, wat mogelijk bijdraagt aan de verspreiding van desinformatie. Vertaalsoftware is ook uitstekend geschikt voor het schrijven van spamberichten en in de context van verschillende vormen van online fraude, zoals de zogenaamde sweepstakes scam of romance scamming. 

Een ander risico bij het gebruik van AI-gebaseerde vertaal- en tekstgeneratiesoftware is de uitvoer van problematische inhoud of vulgair taalgebruik. Als grof taalgebruik of racistische, seksistische of religieuze stereotypen voorkomen in de trainingsgegevens van de software, bestaat altijd het risico dat deze ook worden gebruikt of gereproduceerd in de gegenereerde output. 

Naarmate het gebruik van software toeneemt, neemt ook de kans op misbruik toe. Eindgebruikers moeten zich ook bewust zijn van hun verantwoordelijkheid in hoe ze de software gebruiken en wat er gebeurt met de output. 

TECHNOLOGIEËN KUNNEN VERSTANDIG GEBRUIKT WORDEN IN DE KLAS 

Hoe kunnen leerkrachten AI-gebaseerde software op een constructieve manier gebruiken en het bewustzijn van verantwoord gebruik van deze technologieën in de klas vergroten? Eén manier is werken met automatisch vertaalde en gegenereerde teksten om het metalinguïstisch bewustzijn van leerlingen te vergroten en hen de beperkingen van de software te laten zien. 

Bij machinevertaling, zelfs vanuit het Engels of Spaans, heeft de software moeite met geslacht of weggelaten persoonlijke voornaamwoorden - er kunnen nog steeds fouten optreden. Vertaalsoftware heeft ook vaak problemen met het vertalen van metaforen en allegorieën waarbij de formulering sterk afwijkt van de werkelijke betekenis van de uitspraak. De software slaat ook niet altijd de juiste toon aan wat betreft context, geadresseerden en taalregister. Leerlingen de semantische, grammaticale en stilistische fouten en inconsistenties in een machine vertaalde tekst laten corrigeren kan bijdragen aan dit bewustzijn. 

Machinetekstgeneratoren kunnen ook goed geïntegreerd worden in het vreemdetalenonderwijs. Omdat de tekstgeneratoren geen eigen kennis van de wereld hebben, maar woordreeksen genereren op basis van statistische gegevens, komt de output niet altijd overeen met wat eigenlijk verwacht werd van de software. Hoewel het voor tekstgeneratoren bijvoorbeeld geen probleem is om een fantasieverhaal met een specifiek plot te schrijven, vinden ze het veel moeilijker om non-fictieteksten over gespecialiseerde technische onderwerpen te schrijven. Tekstgeneratoren hebben ook te maken met de stilistische problemen die genoemd zijn in de context van machinevertaling. In de klas zou het daarom mogelijk zijn om met machinaal gegenereerde teksten te werken door leerlingen te vragen om ze op verschillende manieren te reviseren - of het nu is om de teksten aan te passen aan een bepaald register of een bepaalde geadresseerde of om aan bepaalde inhoudelijke eisen te voldoen bij het schrijven van een non-fictietekst. 

Leerkrachten hebben ook de mogelijkheid om de tekstgeneratoren te gebruiken als onderdeel van de lesvoorbereiding, bijvoorbeeld om nieuwe woordenschat te introduceren. Je kunt het algoritme bijvoorbeeld een bepaald onderwerp geven en een aantal woorden noemen die in een te genereren tekst moeten voorkomen, en het algoritme voert dit uit. 

Machinaal gegenereerde tekst om woordenschat over het onderwerp vakantie te introduceren
Een voorbeeldtekst geproduceerd door de OpenAI GPT-3 Playground voor de introductie van woordenschat | © OpenAI
Naast de grote voordelen hebben de technologieën ook een groot potentieel voor misbruik. Leerkrachten kunnen strategieën in de klas ontwikkelen die een verantwoord en constructief gebruik van AI-gebaseerde software mogelijk maken. 
 
Bronnen

Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence. Abgerufen am 5. Juli 2022, von https://slator.com/deepl-got-machine-translation-plans-make-money/.

Raveling, Jann (2022): Was ist ein neuronales Netz?. Wirtschaftsförderung Bremen GmbH. Abgerufen am 5. Juli 2022, von https://www.wfb-bremen.de/de/page/stories
/digitalisierung-industrie40/was-ist-ein-neuronales-netz.

Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Abgerufen am 5. Juli 2022, von https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.

Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do?. Medium. Abgerufen am 5. Juli 2022, von https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.

Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Abgerufen am 5. Juli 2022, von https://www.dw.com/en/d
eepl-cologne-based-startup-outperforms-google-translate/a-46581948
.

Top