Umjetna inteligencija u nastavi stranih jezika
„KAKO UMJETNA INTELIGENCIJA UTIRE PUT KA NASTAVI STRANIH JEZIKA“

Wandförmige Binärcodes bilden Übertragungsleitungen aus Impulsen, Digitale Informationen in Analogie zu einer Nervenzelle
Umjetna neuronska mreža (simbolička slika) | © Adobe Stock

Tehnologija umjetne inteligencije zaista je sveprisutna, dok nastava stranih jezika postaje bez nje skoro pa nezamisliva. Ovim tekstom pružit ćemo vam uvid u polje tzv. Natural Language Processing, te ukazati na mogućnosti upotrebe tehnologija baziranih na umjetnoj inteligenciji u nastavi.

Vrlo često u svakodnevnom životu susrećemo tehnologije bazirane na umjetnoj inteligenciji (UI).  Od personaliziranih rezultata pretraživanja na internetskim tražilicama i oglasa na društvenim mrežama, preko digitalnih jezičkih pomagala i pametnih kućanskih uređaja, pa sve do otključavanja telefona pomoću prepoznavanja lica, tehnologija umjetne inteligencije proširila se na mnoga područja svakodnevnog života. Pa tako je već neko određeno vrijeme rastuća njena popularnost i u nastavi stranih jezika. Tu se zapravo radi o dvije pojedinačne oblasti discipline koju nazivamo Natural Language Processing: o mašinskom prevođenju i mašinskom generiranju tekstova.
 

Natural Language Processing, dakle prirodna jezička obrada, zajednička je disciplina lingvistike, informatike i istraživanja umjetne inteligencije. Njen cilj je „razumijevanje“ govornog jezika ili tekstova pomoću računara, tako da se ovi mogu upotrijebiti, primjerice, za analizu i generiranje tekstova, mašinsko prevođenje, te raspoznavanje jezika. Kako bi se postiglo takvo razumijevanje, potrebni su algoritmi koji su u stanju pronaći i nanovo prepoznati šablone u velikoj količini nestrukturiranih podataka – takozvane neuronske mreže.
 

Ljudsko i mašinsko prevođenje teško se mogu međusobno razlikovati

Softveri za prevođenje u međuvremenu su se čvrsto etablirali u nastavi stranih jezika. Ako neko ko uči strani jezik nešto ne razumije, intuitivno će posegnuti za pametnim telefonom, kako bi razjasnio značenje nepoznatih riječi ili rečenica. Za razliku od dosadašnjih teških rječnika, pametni telefon svakako je uvijek u blizini, a samo traženje čini značajno bržim. Navedeni softveri omiljeni su i kod pisanja tekstova koji su najprije osmišljeni na maternjem jeziku.

Dok su se do prije nekoliko godina mašinski generirani tekstovi pri čitanju odmah mogli prepoznati kao takvi, istraživanje na polju prevodilačkih tehnologija ostvarilo je ogroman napredak u posljednjoj deceniji, tako da je danas skoro pa nemoguće prepoznati da li je neki prevod sačinio čovjek ili mašina. Nastavnici to u svom poslu itekako primjećuju, primjerice kada neko ko u nastavi pokazuje prosječne rezultate na polju produktivnog pisanja, svaki tekst koji dobije za zadaću uradi bez ijedne gramatičke i pravopisne greške.


Primjer za nevjerojatni brzi rast prevodilačkih softvera baziranih na UI koje svakodnevno koristi preko milion ljudi, svakako je DeepL kojeg je 2017. godine razvila jedna kompanija iz Kölna. Na temelju statističkih podataka, tekstovi se prevode na 28 jezika, tako što se daje pregled vjerojatnosti određenih riječi u određenim kontekstima. Pritom se u obzir uzima nekoliko milijardi parametara.

Kompanija redovito sprovodi mjere za osiguranje visoke kvalitete generiranih prevoda. Tako je primjerice 2017. godine sprovedena studija naslijepo, u kojoj je grupa profesionalnih prevodilaca trebala prevesti 100 rečenica koje je paralelno preveo i DeepL, te tri konkurentska prevodilačka softvera velikih tehnoloških kompanija. Pritom su se tekstovi koje je preveo DeepL pokazali tri puta uspješniji od onih koje je preveo softver jedne poznate internetske tražilice, budući da su ih ljudski prevodioci ocijenili kao puno prirodnije.

Übersetzung vom Englischen ins Deutsche mit Synonymfunktion für Wörter und Formulierungen. Primjer prevoda kojeg je sačinio DeepL | © DeepL

Softver koji piše domaću zadaću

Osim mašinskog prevođenja tekstova, postoji još jedno zasebno područje na polju Natural Language Processing koje se imalo priliku tehnički jako razviti u skorije vrijeme - mašinsko generiranje tekstova. Organizacija koja je u tom smislu posljednjih godina uvijek iznova privlačila pažnju je OpenAI. Ova organizacija sa sjedištem u San Franciscu, osnovana 2015. godine, bavi se istraživanjem umjetne inteligencije i razvojem algoritama koji mogu generirati i upotpunjavati tekstove.

Najnoviji takav algoritam, nazvan Generative Pretrained Transformer 3 (GPT-3), prvi je put predstavljen 2020. godine u vidu naučne publikacije. Ovaj jezički model, trenutno najuspješniji svoje vrste, istestiran je na osnovu 45 terabajta podataka, a temelji se na neuronskoj mreži od 175 milijardi parametara. Ovaj se softver razlikuje od uobičajenih generatora teksta na dva načina – s jedne strane, ne upotrebljavaju se nikakvi unaprijed pripremljeni tekstualni blokovi, i s druge strane, ovaj algoritam nije specijaliziran za neko određeno tematsko područje, nego generira odgovarajuće rečenice za skoro svaku postojeću oblast. Kao i kod DeepL, i neuronska mreža GPT-3 počiva na statističkom modelu koji opisuje kontekstualno uslovljenu vjerojatnost riječi i rečenica.

Ako softveru zadate zadatak poput: „Napiši priču o dječaku po imenu Max, koji krene na avanturističko putovanje svijetom“, onda će GPT-3 upravo to i uraditi i napisati odgovarajuću priču. Ovaj algoritam, upotrebljiv na više jezika, ne posjeduje doduše vlastito znanje o svijetu, nego jako dobro predviđa kako bi naredna riječ, odnosno naredna rečenica mogla izgledati. Na taj način i tekstualni generatori postepeno utiru put u nastavu stranih jezika, jer je za osobu koja uči neki strani jezik svakako puno jednostavnije generirati neki sastav ili dijalog na zadanu temu pomoću softvera, nego da ga sama napiše.

Maschinell erzeugte Geschichte über einen Jungen, der sich auf eine (abenteuerliche) Weltreise begibt Primjer priče koju je generirao GPT-3 Playground kompanije OpenAI | © OpenAI

Korištenjem softvera raste i mogućnost njegove zloupotrebe

Pored primjera korištenja softvera, kao što je pisanje tekstova u nastavi stranih jezika, generatori teksta mogu biti upotrijebljeni i u moralno upitne ili kriminalne svrhe. Tako se, primjerice, bez velike muke, mogu napraviti spam poruke ili lažne vijesti. Osim toga, akademski članci mogu se s lakoćom lažirati, što opet može dovesti do potencijalnog širenja dezinformacija. I softveri za mašinsko prevođenje mogu se jako dobro upotrijebiti za pisanje spam poruka, te u kontekstu raznih oblika online prevara, kao što su prevare sa nagradnim igrama ili takozvane ljubavne prevare (“romance scamming”).

Još jedan rizik kod korištenja prevodilačkih ili softvera za generiranje tekstova, baziranih na UI, predstavlja objavljivanje problematičnih sadržaja ili vulgarnog jezika. Ukoliko zajedno sa ulaznim podacima u softver dospiju i nepoželjni izrazi ili rasistički, seksistički ili vjerski stereotipi, javlja se opasnost da će se oni ponovo pojaviti ili upotrijebiti u generiranim izlaznim podacima.

Korištenjem softvera raste i mogućnost njegove zloupotrebe, pa bi krajnji korisnici i korisnice također trebali biti svjesni svoje odgovornosti na koji način koriste softver i šta se dalje dešava sa izlaznim rezultatima.

Tehnologija se može smisleno upotrijebiti u nastavi

Kako nastavnici mogu na konstruktivan način upotrijebiti UI i senzibilizirati korisnike za njeno odgovorno korištenje? Jedna od mogućnosti je rad sa mašinski prevedenim i generiranim tekstovima, u cilju jačanja metajezičke svjesnosti korisnika i ukazivanja na softverska ograničenja.

Kod mašinskog prevođenja čak i sa engleskog ili španskog jezika, softveri se bore sa izostavljenim ličnim zamjenicama ili rodovima i uvijek je moguće da se pojave greške. Prevodilački softveri imaju poteškoća i sa prevođenjem metafora i alegorija, kod kojih sadržaj teksta jako odstupa od stvarnog značenja neke izjave.  Softveri ponekad promaše i sam ton generiranog teksta, u ovisnosti o kontekstu, onome kome je tekst adresiran i jezičkom registru. Ono što bi doprinijelo senzibiliziranju je davanje prilike korisnicima za ispravljanje semantičkih, gramatičkih i stilističkih grešaka i nedosljednosti mašinski prevedenih tekstova.

I mašinski generatori teksta mogu se korisno upotrijebiti u nastavi stranih jezika. Budući da generatori teksta ne posjeduju vlastito znanje o svijetu, nego generiraju slijedove riječi pomoću statističkih podataka, izlazni rezultati ne odgovaraju uvijek stvarnim očekivanjima od softvera. Pa tako, primjerice, za generator teksta ne predstavlja problem napisati neku fantastičnu priču sa određenom radnjom, dok će mu pisanje stručnih tekstova na specifične teme zadati dosta poteškoća. Generatori teksta pogođeni su i stilističkim problemima, već spomenutim u kontekstu mašinskog prevođenja. Na nastavi bi se, dakle, moglo raditi sa mašinski generiranim tekstovima tako što bi se korisnicima dalo da prerade neki tekst na različite načine, bilo da se radi o prilagođavanju teksta nekom određenom registru - npr. nekom specifičnom adresatu - ili o određenim sadržajnim zahtjevima prilikom pisanja nekog stručnog teksta.

Nastavnicima se nudi i mogućnost upotrebe generatora teksta u pripremi nastave, naprimjer kod uvođenja novog vokabulara. Algoritmu se tako može zadati neka određena tema i navesti riječi koje bi trebale biti sadržane u tekstu, a algoritam će to sprovesti u djelo.

Maschinell erzeugter Text zur Einführung von Wortschatz zum Thema Urlaub Primjer teksta kojeg je sačinio GPT-3 Playground kompanije OpenAI sa ciljem uvođenja vokabulara | © OpenAI Nove tehnologije, pored velike koristi, kriju i veliku mogućnost zloupotrebe. Nastavnici mogu razviti strategije za omogućavanje odgovorne i konstruktivne upotrebe softvera baziranog na umjetnoj inteligenciji
 
Izvori

Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence.
Preuzeto 5. jula 2022. sa   https://slator.com/deepl-got-machine-translation-plans-make-money/.

Raveling, Jann (2022): Was ist ein neuronales Netz?. Wirtschaftsförderung Bremen GmbH. Preuzeto 5. jula 2022. sa https://www.wfb-bremen.de/de/page/stories
/digitalisierung-industrie40/was-ist-ein-neuronales-netz.


Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Preuzeto 5. jula 2022. sa ​​​​​​​ https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.

Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do?. Medium. Preuzeto 5. jula 2022. sa ​​​​​​​ https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.

Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Preuzeto 5. jula 2022. sa ​​​​​​​ https://www.dw.com/en/d
eepl-cologne-based-startup-outperforms-google-translate/a-46581948
.