Umělá inteligence při výuce cizích jazyků
Oprava textů při výuce jazyků zůstává manuální prací
„Vysoce kvalitní texty po pouhém stisknutí tlačítka“ slibuje řada poskytovatelů digitálních asistentů psaní. Strojové systémy jsou v současnosti už skutečně schopny okamžitě vygenerovat komplexní opravu textu a návrhy na jeho zlepšení. Jak dobré ale tyto opravy opravdu jsou? A umí pomoci studentům cizího jazyka k tomu, aby sami dokázali dobré texty napsat?
Od: Dr. Moritz Dittmeyer
Někdo by se mohl ptát, jaký má ještě smysl učit se cizí jazyky, když už na internetu existuje množství nových jazykových technologií a podpůrných digitálních nástrojů. Inteligentní aplikace (DeepL, Google Translate) naše texty v řádu milisekund přeloží nebo nás podpoří v tom, abychom je sami psali bez chyb a ve vysoké kvalitě: ať už jde o funkci automatických oprav v kancelářské aplikaci a v našem prohlížeči, nebo o komplexnější asistenty psaní, jako je Duden-Mentor, Grammarly nebo LanguageTool.
Mnozí poskytovatelé těchto takzvaných asistentů psaní nás lákají na to, že nás mohou v každé naší životní situaci obšťastnit lepšími texty a učinit nás tak úspěšnějšími. Do repertoáru těchto aplikací patří jak kontrola pravopisu, gramatiky a interpunkce, tak také stylistická optimalizace textů nebo přeformulování celých vět.
Není tedy nasnadě, abychom tyto nové opravné asistenty využívali i při výuce jazyků? A potřebujeme vůbec ještě školené učitele, když jsou opravy a zlepšovací návrhy prováděné strojovými aplikacemi údajně přece mnohem rychlejší, přesnější a objektivnější?
LanguageTool pod lupou
Studie, kterou provedl Goethe-Institut společně s vědci z Humboldtovy univerzity v Berlíně, ukázala, že tak jednoduché to zase není. Současné nástroje pro autokorekci mohou sice rodilým mluvčím nebo pokročilým studentům jazyka pomoci vytvářet lepší texty, nejsou ale smysluplným nástrojem pro to, jak se je v cizím jazyce naučit psát - zvláště, pokud se dotyčný tento jazyk teprve začíná učit. Autokorekční nástroje lze z didaktického i z kvalitativního hlediska doporučit pouze v případě, že jsou rozsáhle revidovány.Předmětem studie byl LanguageTool: open-source aplikace pro kontrolu gramatiky, stylistiky a pravopisu řady jazyků, která díky svému otevřenému zdrojovému kódu tvoří základ mnoha opravných aplikací na internetu. V současnosti se LanguageTool vyvinul v plnohodnotného pomocníka při psaní, který teprve v placené verzi nabízí vše, co umí. Podle vyjádření jeho tvůrců jej používají miliony lidí po celém světě. Na LanguageTool je navázána aktivní komunita, která aplikaci neustále zlepšuje. Aktuální verze LanguageTool pro němčinu aktuálně čítá více než 4500 gramatických, interpunkčních, pravopisných, typografických, idiomatických, gendrovacích a dalších pravidel.
Experiment
V přímém porovnání nástroje LanguageTool s učiteli z Goethe-Institutu vynikla nepřesnost aplikace. V textech studentů jazykových kurzů Goethe-Institutu na úrovni A2 aplikace označila výrazně více chyb než lidští lektoři. Často se přitom ale jednalo o chyby, které chybami buď nebyly, nebo o chyby irelevantní, jako jsou opravy vlastních jmen či jiných částí vět a o jevy, které ještě neodpovídaly tomu, co žáci mají znát. U složitější gramatiky byl pozorován opak. Zejména chyby ve větné stavbě aplikace téměř nezaznamenala, což vedlo k její celkově velmi nízké úspěšnosti.Za nízkou přesnost a úspěšnost nástroje LanguageTool jsou zodpovědné technologické přístupy, které neumí identifikovat gramatické chyby, a kterým se nedaří provádět korektury na významové úrovní. Aplikace, která chce text korigovat smysluplně, by musela zohlednit také semantické informace a uvažovat v kontextech, třeba už proto, aby dokázala v textu identifikovat vlastní jména, a ne je opravovala jako chybná.
Příklad studentského textu opravovaného nástrojem LanguageTool | © Goethe-Institut
Korektivní zpětná vazba při výuce cizích jazyků
Ve skutečnosti se ukazuje, že situace je ještě složitější. Při studiu cizího jazyka jde ve své podstatě o to naučit se nějaký úplně nový jazyk. Oprava textů tedy zahrnuje i didaktickou složku. Optimální korektivní zpětná vazba přitom závisí na konkrétní situaci žáka a na jeho stylu učení. Může být cílená a implicitní, ale také všezahrnující a explicitní. Učitel může například žáky upozornit na konkrétní problém tím, že se při opravě jejich textů zaměří na určité typy chyb. Implicitní opravy mohou žáky motivovat k tomu, aby se sami zabývali dalšími, momentálně upozaděnými pravidly. Učitelé, s nimiž jsme vedli rozhovory, kritizovali u oprav a zlepšovacích návrhů aplikace LanguageTool právě tyto didaktické nedostatky. Kromě toho bylo opakovaně zdůrazňováno, že špatně identifikované chyby a špatné opravy jsou pro studenty jazyka obzvláště problematické, neboť studenti sami nejsou schopni rozpoznat, že se aplikace plete. A opomenuty by neměly být ani motivačně-psychologické faktory. Příliš mnoho oprav (a tím spíše, jsou-li nesprávné), může mít na chování učícího se studenta demotivující účinek.závěr & výhled
Bez komplexních a specifických úprav pro výuku němčiny jako cizího jazyka je technologie LanguageTool jen stěží vhodná k tomu, aby adekvátně opravovala texty studentů němčiny.Kromě přístupů založených na pravidlech existuje již několik let také možnost používat k opravě a vylepšování textů tzv. jazykové modely. Jazykovými modely se zde myslí komplexní předtrénované architektury neuronových sítí, které jsou schopny modelovat jazyk v celé jeho šíři. Co je na tom zvláštního, je to, že tyto jazykové modely jsou všímavé a schopné se učit. Určitou úroveň porozumění získávají tím, že slovům nebo jejich částem přiřazují význam a kontext.
Ve vývoji jazykových modelů v poslední době opakovaně padla řada rekordů. Tyto síťové architektury jsou výborné v tom, jak dokáží přirozenému jazyku "porozumět", jak s ním manipulují a napodobují ho. Jedním z těch nejznámějších jazykových modelů je Generative Pretrained Transformer 3 (GPT-3) od americké organizace OpenAI.
Nicméně i tyto jazykové modely by musely být nákladně upraveny, aby byly schopny opravovat a zdokonalovat texty studentů. Komplexní jazykové modely, které v současnosti existují, jsou připravené k použití především pro anglický jazyk. Běžná praxe při opravě německých textů je takováto: přeložit je nejdříve do angličtiny, v ní je vylepšit, a poté vše přeložit zpět do němčiny. Tento postup však někdy vede k tomu, že texty se v průběhu jednotlivých kroků procesu samy sobě odcizí a dostanou se do nich slova, idiomy a gramatické struktury, které studenti jazyka ještě vůbec neznají.
K tomu je nutno přičíst skutečnost, že jazykové modely byly "vycvičeny" na to, aby fungovaly v ideálním, resp. v běžném užívání jazyka. Nemohou proto provádět didakticky diferencované opravy. A protože zde roli zde hraje nejen ideální používání jazyka, ale, jak bylo uvedeno výše, i další faktory, nejsou navrhované opravy a zlepšení často vůbec k užitku těm studentům, kteří jsou teprve na nízké úrovni jazykového vzdělávání.
Příklad studentského textu optimalizovaného jazykovým modelem (GPT-NeoX 20B via https://nlpcloud.com) | © Goethe-Institut U jazykových modelů navíc hrozí nebezpečí, že již nebudeme schopni pochopit, proč je určitá oprava nebo vylepšení vůbec prováděno. Na rozdíl od přístupů založených na pravidlech zde neexistují žádná specifikovatelná pravidla, která by umožňovala vyvodit z oprav závěr, opravy jsou založeny - zjednodušeně řečeno - jen na tom, co se modelu v daném kontextu celkově statisticky jeví jako nejpravděpodobnější. Interpunkční znaménko nebo slovo označené jako nesprávné se nahradí interpunkčním znaménkem nebo slovem, které se v daném kontextu věty a textu vyskytuje nejčastěji.
A s ohledem na udržitelnost je také třeba zmínit, že používání jazykových modelů je energeticky velmi náročné. Vývoj, trénink a provoz velkých jazykových modelů, jako je slavný GPT-3, spotřebovává tisíce megawattů elektrické energie, stojí miliony a vyžaduje miliardy datových bodů.
To, aby byly texty žáků opravovány vhodným a didakticky smysluplným způsobem, tak zatím zůstává úkolem vyškolených učitelů.
POCHYBUJETE?
Pak si to vyzkoušejte sami. Zde naleznete dva anonymizované studentské texty, které si můžete nechat opravit jazykovým asistentem dle své volby.Hallo Kadira. Mein Traum haus hat eine großküche, ein groß und hell bad mit ein groß Spiegel. Mein Slafszimmer hat einen groß bett, viel Schranks, Meinen Arbeitzimmer hat einen Bibliothek, einen Tisch für den Computer un ein bequemer Stuhl. Sie hat auch ein großer und farbenfroher Garten. Mit Freundlichen Grüßen, Tho
Liebe Taisha. Das ist meine Tag. Jeden Morgen ich aufstehe um 5:30 Uhr und ich zaubere den Frühstück für mich und meine Tochter Khaleesi. Dann ich arbeite bis 16 Uhr. ; Von 16:15 bis 18:45 spiele ich mit Khaleesi, um 19 Uhr haben wir das Abendessen und ich vorbereite Khaleesi für das Bett um 8 Uhr. Sie habe ein Bad und sie schlaft von 21 Uhr. Dann ich arbeite, zaubere die Essen für den Morgen oder ich lerne Deutsch. Es kann helfen um eine Kultur besser zu verstanden, und auch um mehrere Leute zu können lernen. Viele Grüße, Sichin
Sylvio Rüdian, Moritz Dittmeyer a Niels Pinkwart (2022): Challenges of using auto-correction tools for language learning. In LAK22: 12th International Learning Analytics and Knowledge Conference (LAK22). Association for Computing Machinery, New York, NY, USA, 426–431. https://doi.org/10.1145/3506860.3506867
Nassaji, H., & Kartchava, E. (Herausgeber) (2021): The Cambridge Handbook of Corrective Feedback in Second Language Learning and Teaching (Cambridge Handbooks in Language and Linguistics). Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108589789
Komentáře
Komentovat