L'intelligence artificielle dans l'enseignement des langues étrangères
Comment les logiciels basés sur l'intelligence artificielle font leur entrée dans l'enseignement des langues étrangères
Les technologies basées sur l'IA sont omniprésentes et sont devenues incontournables dans le domaine de l'enseignement des langues étrangères. Voici un aperçu du Natural Language Processing et du potentiel des technologies basées sur l'IA dans l'enseignement.
De Tobias Brockhorst
Nous rencontrons très souvent dans notre vie quotidienne des technologies basées sur l'intelligence artificielle (IA). Des résultats de recherche personnalisés dans les moteurs de recherche Internet et des publicités dans les réseaux sociaux, en passant par les assistants vocaux numériques et les appareils de maison connectée, jusqu'à la reconnaissance faciale pour déverrouiller un smartphone, les technologies basées sur l'IA se sont étendues à de nombreux domaines de la vie. Depuis quelque temps, elles sont également de plus en plus populaires dans l'enseignement des langues étrangères. Nous nous intéressons ici à deux sous-domaines du Natural Language Processing : la traduction automatique et la génération automatique de textes.
Il est difficile de distinguer une traduction humaine d'une traduction automatique
Les logiciels de traduction sont désormais bien établis dans l'enseignement des langues étrangères. En cas de difficultés de compréhension, les apprenant·e·s se tournent souvent immédiatement et intuitivement vers leur smartphone pour trouver la signification de mots ou de phrases qu'ils/elles ne connaissent pas. Comparé aux lourds dictionnaires traditionnels, le smartphone présente les avantages d'être toujours à portée de main et de permettre une recherche nettement plus rapide. Les logiciels de traduction sont également très appréciés pour la production de textes initialement rédigés dans la langue maternelle.Alors qu'il y a quelques années, les textes traduits par des machines pouvaient être immédiatement identifiés comme tels par les lecteurs et les lectrices, la recherche dans le domaine de la technologie de la traduction a fait des progrès considérables au cours de la dernière décennie, de sorte qu'il est aujourd'hui presque impossible de savoir si une traduction a été réalisée par un être humain ou par un ordinateur. Bien entendu, les enseignant·e·s le remarquent souvent en classe, par exemple lorsqu'un·e apprenant·e n'obtient que des résultats moyensen expression écrite, mais que tous les textes rédigés par l'apprenant·e comme des devoirs à la maison sont irréprochables sur le plan grammatical et orthographique.
Un exemple des progrès fulgurants des logiciels de traduction basés sur l'IA, utilisés quotidiennement par plus d'un million de personnes, est le site DeepL, développé en 2017 par une entreprise allemande de Cologne. Les traductions, qui se font désormais en 28 langues, sont réalisées à partir de données statistiques qui décrivent la probabilité de certains mots dans certains contextes. Pour ce faire, plusieurs milliards de paramètres sont pris en compte.
L'entreprise met régulièrement en œuvre des mesures pour garantir une haute qualité des traductions générées. Par exemple, en 2017, une étude à l'aveugle a été menée, au cours de laquelle un groupe de traducteurs et traductrices professionnel·e·s a été confronté à 100 phrases traduites respectivement par DeepL et par trois logiciels de traduction concurrents de grandes entreprises tech. Les textes générés par DeepL ont obtenu des résultats trois fois meilleurs que les textes de sortie d'un logiciel de traduction de moteur de recherche connu, car les traducteurs humains les ont trouvés nettement plus naturels.
Exemple de traduction réalisé par le traducteur DeepL | © DeepL
Faire rédiger ses devoirs par un logiciel
Outre la traduction automatique de textes, il existe un autre domaine du Natural Language Processing qui a récemment réalisé de grands progrès techniques : la génération automatique de textes. Une organisation qui a régulièrement fait les gros titres dans ce contexte au cours des dernières années est OpenAI. Cette organisation basée à San Francisco, fondée en 2015, s'occupe de la recherche sur les intelligences artificielles et développe entre autres des algorithmes capables de rédiger et de compléter des textes.Le dernier de ces algorithmes, qui porte le nom de Generative Pretrained Transformer 3 (GPT-3), a été présenté pour la première fois en 2020 sous la forme d'une publication scientifique. Le modèle linguistique est actuellement le plus grand de son genre, il a été entraîné à l'aide de 45 To de données et se base sur un réseau neuronal de 175 milliards de paramètres. Le logiciel se distingue des générateurs de texte traditionnels à deux égards - d'une part, il n'utilise pas de blocs de texte prédéfinis, d'autre part, l'algorithme n'est pas spécialisé dans un domaine thématique ou d'application particulier, mais fournit des phrases adaptées à presque tous les domaines. Comme DeepL, le réseau neuronal de GPT-3 est basé sur un modèle statistique qui décrit la probabilité des mots et des phrases en fonction du contexte.
Si l'on donne au logiciel une entrée telle que « Écrivez une histoire sur un garçon nommé Max qui part à l'aventure autour du monde », l'algorithme de GPT-3 commence à faire exactement cela et rédige un récit correspondant. L'algorithme, qui peut être utilisé dans différentes langues, ne dispose toutefois pas d'une connaissance du monde propre, mais est seulement très doué pour prédire à quoi pourrait ressembler le prochain mot ou la prochaine phrase. C'est ainsi que les générateurs de texte font peu à peu leur entrée dans l'enseignement des langues étrangères, car il est naturellement beaucoup plus facile pour un·e participant·e de faire générer par un logiciel une rédaction ou un dialogue sur un thème donné que de le rédiger lui/elle-même.
Exemple d'histoire créé par OpenAI GPT-3 Playground | © OpenAI
Plus un logiciel est utilisé, plus le risque qu'il soit détourné de sa fonction augmente
Les générateurs de texte peuvent également être utilisés à des fins moralement douteuses ou criminelles. Il est par exemple possible de créer sans grand effort des messages de spam uniques et des infox. En outre, des articles académiques peuvent être facilement falsifiés, ce qui est susceptible de contribuer à la diffusion de la désinformation. Les logiciels de traduction automatique sont également très utiles pour la rédaction de spams et dans le cadre de diverses formes d'escroquerie en ligne, comme l'escroquerie aux jeux-concours ou l'escroquerie sentimentale.Un autre risque lié à l'utilisation de logiciels de traduction et de génération de texte basés sur l'IA est l'édition de contenus problématiques ou de langage vulgaire. Si des termes grossiers ou des stéréotypes racistes, sexistes ou religieux apparaissent dans les données d'entraînement du logiciel, il y a toujours un risque qu'ils soient utilisés ou reproduits dans l'output généré.
Le potentiel d'abus d'un logiciel augmente avec son utilisation. Les utilisateurs et utilisatrices en bout de chaîne devraient également être conscient·e·s de leur responsabilité dans la manière dont ils et elles utilisent le logiciel et dans ce qu'il advient des résultats.
Les technologies peuvent être utilisées à bon escient dans l'enseignement
Comment les enseignant·e·s peuvent-ils/elles utiliser les logiciels basés sur l'IA de manière constructive et sensibiliser à une utilisation responsable de ces technologies en classe ? Une possibilité est de travailler avec des textes traduits et générés par des machines afin de renforcer la conscience métalinguistique des apprenant·e·s et de leur montrer les limites des logiciels.Lors de la traduction automatique, même à partir de l'anglais ou de l'espagnol, les logiciels doivent lutter contre les genres ou même les pronoms personnels omis - des erreurs peuvent encore survenir. Les logiciels de traduction ont également souvent des problèmes avec la traduction de métaphores et d'allégories, dont le texte s'écarte fortement du sens réel du message. Les logiciels ne trouvent pas toujours le ton juste en ce qui concerne le contexte, les destinataires et le registre linguistique. Faire corriger par les apprenant·e·s les erreurs et incohérences sémantiques, grammaticales et stylistiques d'un texte traduit par une machine peut contribuer à cette sensibilisation.
Les générateurs de textes automatiques peuvent également être facilement intégrés dans l'enseignement des langues étrangères. Du fait que les générateurs de texte ne disposent pas de connaissances du monde propres, mais génèrent des suites de mots à l'aide de données statistiques, les résultats ne correspondent pas toujours à ce qui est attendu du logiciel. Ainsi, les générateurs de texte n'ont certes aucun problème à écrire une histoire imaginaire avec une intrigue précise, mais ils ont beaucoup plus de mal à rédiger des textes factuels sur des sujets spécialisés. Les générateurs de texte sont également concernés par les problèmes stylistiques mentionnés dans le contexte de la traduction automatique. Il serait donc possible de travailler en classe avec des textes générés par la machine en demandant aux apprenant·e·s de les retravailler de différentes manières - que ce soit pour adapter les textes à un registre ou à un·e destinataire particulier ou pour répondre à certaines exigences en matière de contenu lors de la rédaction d'un texte factuel.
Les enseignant·e·s ont également la possibilité d'utiliser les générateurs de texte dans le cadre de la préparation de leurs cours, par exemple pour introduire un nouveau vocabulaire. On peut par exemple donner à l'algorithme un thème précis et nommer quelques mots qui doivent figurer dans un texte à générer, et l'algorithme les met en œuvre.
Un exemple de texte créé par OpenAI GPT-3 Playground dans le but d'introduire du vocabulaire | © OpenAI Ces technologies sont très utiles mais le risque que leur usage soit détourné est élevé. Les enseignant·e·s peuvent développer en classe des stratégies permettant une utilisation responsable et constructive des logiciels basés sur l'IA.
Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence. Consulté le 5 juillet 2022, de https://slator.com/deepl-got-machine-translation-plans-make-money/.
Raveling, Jann (2022): Was ist ein neuronales Netz?. Wirtschaftsförderung Bremen GmbH. Consulté le 5 juillet 2022, de https://www.wfb-bremen.de/de/page/stories
/digitalisierung-industrie40/was-ist-ein-neuronales-netz.
Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Consulté le 5 juillet 2022, de https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.
Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do?. Medium. Consulté le 5 juillet 2022, de https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.
Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Consulté le 5 juillet 2022, de https://www.dw.com/en/deepl-cologne-based-startup-outperforms-google-translate/a-46581948.