בינה מלאכותית בתחום של הוראת שפות זרות
כיצד תוכנה מבוססת בינה מלאכותית נכנסת לתחום של הוראת שפות זרות
נראה כי טכנולוגיה מבוססת בינה מלאכותית נמצאת בכל מקום. לא ניתן עוד לדמיין הוראת שפות זרות בלעדיה. להלן ניתן מבוא לתחום של עיבוד שפה טבעית ונדגים את הפוטנציאל הגלום בטכנולוגיות מבוססות בינה מלאכותית בהוראה.
מאת טוביאס ברוקהורסט
אנו נתקלים בטכנולוגיות מבוססות בינה מלאכותית בחיי היומיום לעיתים קרובות מאוד. טכנולוגיות אלו התפשטו לתחומי חיים רבים: החל בתוצאות חיפוש מותאמות אישית במנועי חיפוש באינטרנט ופרסומות ברשתות החברתיות, עבור בעוזרות קוליות ומוצרי בית חכם וכלה בביטול נעילה בפלאפון באמצעות זיהוי פנים. הן זוכות לפופולריות הולכת וגדלה גם בהוראת שפות זרות מזה זמן רב. מדובר בשני תתי תחומים של עיבוד שפה טבעית: תרגום מכונה והפקת טקסטים בידי מכונה.
עיבוד שפה טבעית , כלומר עיבוד טבעי של השפה, הוא תחום דעת משותף לבלשנות, מדעי המחשב וחקר של בינה מלאכותית. מטרתו היא "הבנת" שפה דבורה או טקסטים באמצעות מחשב, באופן שניתן יהיה להשתמש בהם, למשל, לצורך הערכה והפקה של טקסטים, לתרגום מכונה ולמערכת זיהוי דיבור. כדי לאפשר הבנה זו זקוקים לאלגוריתמים המסוגלים למצוא ולזהות דפוסים בתוך כמות גדולה של נתונים לא מובנים - מה שמכונה רשתות עצביות מלאכותיות.
לא ניתן כמעט להבדיל בין תרגום אנושי לתרגום מכונה
תוכנות תרגום הפכו להיות מבוססות היטב בהוראת שפות זרות. כשיש ללומדי שפה קשיי הבנה לעיתים קרובות הם נעזרים מייד בטלפון החכם שלהם כדי להבין את המשמעות של מילים או משפטים. בניגוד למילונים המודפסים והכבדים, הטלפון החכם זמין בכל עת וגם החיפוש בו קל יותר. התוכנה פופולרית מאוד גם לצורך יצירת טקסטים שנכתבו במקור בשפת האם.עד לפני כמה שנים קוראים יכלו לזהות בקלות ומייד טקסטים שתורגמו בתרגום מכונה. ואולם בעשור האחרון חלה התקדמות רבה במחקר בתחום טכנולוגיית התרגום. היום כמעט בלתי אפשרי לדעת אם התרגום נעשה בידי אדם או בידי מחשב. ודאי שמורים.ות שמים לב לכך בשיעורים, למשל כאשר לתלמיד מסוים יש הישגים בינוניים בתחום הכתיבה, אך כשהוא מגיש טקסט שנכתב בבית אין בו טעויות כתיב או טעויות דקדוקיות בכלל.
דוגמה להתקדמות המהירה של תוכנת תרגום מבוססת בינה מלאכותית, שלמעלה ממיליון איש עושים בה שימוש יומיומי היא DeepL. את התוכנה פיתחה חברה בקלן בשנת 2017. התרגומים ל-28 שפות נכון להיום נעשים באמצעות נתונים סטטיסטיים המתארים את ההסתברות של מילים מסוימות בהקשרים מסוימים. לוקחים בחשבון כמה מיליארדי פרמטרים.
החברה נוקטת אמצעים באופן קבוע כדי להבטיח איכות גבוהה של תרגומים. כך למשל בשנת 2017 נערך מחקר עיוור שבו קבוצת מתרגמים מומחים בשר ודם קיבלה מאה משפטים. כל אחד מהמשפטים תורגם בידי תוכנת DeepL ושלוש תוכנות תרגום מתחרות של חברות טכנולוגיה גדולות. התוצאות היו חד משמעיות: הטקסטים שתורגמו בידי DeepL היו טובים פי כמה מאלו שתורגמו בידי התוכנות האחרות. לדברי קבוצת המתרגמים המומחים הטקסטים הללו נשמעים טבעיים יותר באופן משמעותי.
תרגום לדוגמה שנוצר בידי תוכנת | © DeepL
התוכנה מכינה את שיעורי הבית
לצד תרגום מכונה של טקסטים, קיים תת תחום נוסף בתחום של עיבוד שפה טבעית שהגיע להתקדמות טכנולוגית משמעותית לאחרונה - תוכנה ליצירת תוכן. ארגון שעלה שוב ושוב לכותרות בהקשר הזה בשנים האחרונות הוא חברת OpenAI שבסיסה בסן פרנסיסקו. החברה שנוסדה בשנת 2015 עוסקת בחקר של בינה מלאכותית. בין היתר היא מפתחת אלגוריתמים שמסוגלים לחבר ולהשלים טקסטים.האלגוריתם החדש והמתקדם ביותר שפיתחה חברת OpenAI הוא GPT-3, מחולל תוכן של בינה מלאכותית שהוצג לראשונה בשנת 2020 בפרסום מדעי. זהו מודל השפה הגדול מסוגו כיום. הוא מתאמן על נתונים של 45 טרה בייט ומבוסס על רשת עצבית עם 175 מיליארד פרמטרים. ייחודה של התוכנה לעומת מחוללי טקסט רגילים: ראשית לא משתמשים בקוביות טקסט כתובות מראש, שנית האלגוריתם אינו מומחה בנושא או בתחום יישום מסוים, אלא מפיק משפטים מתאימים עבור כל תחום כמעט. בדומה ל-DeepL, הרשת העצבית של GPT-3 מבוססת על מודל סטטיסטי שמתאר את ההסתברות של מילים ומשפטים התלויה בהקשר.
אם נותנים לתוכנה הוראה כמו "נא לכתוב סיפור על נער בשם מקס שיוצא למסע הרפתקאות סביב העולם", האלגוריתם GPT-3 מתחיל לעשות בדיוק את זה ומחבר סיפור בהתאם להוראות. אולם לאלגוריתם, שאפשר להשתמש בו בשפות שונות, אין ידע עולם משלו. יש לו יכולת ניבוי מצוינת כיצד ייראו המילה או המשפט הבאים. וכך אט אט מחוללי טקסט מוצאים את דרכם לשיעורי שפה זרה: ברור שקל יותר ללומד השפה להיעזר בתוכנה שתכתוב עבורו חיבור או דיאלוג על נושא מסוים מאשר שהוא יעשה זאת בעצמו.
דוגמה לסיפור שיצר האלגוריתם GPT-3 של חברת OpenAI | © OpenAI
ככל שהשימוש בתוכנה גדל, כך עולה הסיכון שייעשה בה שימוש לרעה
לצד אפשרויות כמו כתיבת טקסטים בשיעורי שפה זרה, עלול להיות שימוש במחוללי טקסט גם לצורך מטרות מפוקפקות מבחינה מוסרית או פלילית. למשל לא תהיה כל בעיה לייצר הודעות ספאם ייחודיות וחדשות מזויפות. כמו כן ניתן יהיה לזייף מאמרים אקדמיים בקלות, דבר שעלול לתרום להפצה מכוונת של מידע כוזב. גם תוכנת תרגום מכונה עלולה לשמש לצורך כתיבת הודעות ספאם וגם בהקשר של צורות שונות של הונאה מקוונת, למשל מה שמכונה הונאה בתחרות או הונאה רומנטית .סיכון נוסף הנובע משימוש בתוכנות תרגום או מחוללי טקסט המבוססים על בינה מלאכותית הוא תוכן בעייתי או שפה וולגרית. אם התוכנה מתאמנת על ביטויים וולגריים או על סטריאוטיפים גזעניים, סקסיסטיים או דתיים, ייתכן מאוד שהם יבואו לידי ביטוי בתכנים החדשים שנוצרים.
ככל שהשימוש בתוכנה גדל, כך עולה הסיכון שייעשה בה שימוש לרעה. גם משתמשי קצה צריכים להיות מודעים לאחריותם לאופן שבו הם משתמשים בתוכנה ומה קורה לתכנים שנוצרים.
ניתן להשתמש בטכנולוגיות בשיעורים בתבונה
כיצד על מורים להשתמש בתוכנות מבוססות בינה מלאכותית בתבונה ולדאוג לשימוש אחראי בטכנולוגיות אלו? אפשרות אחת היא לעבוד עם טקסטים שתורגמו או נוצרו במכונה הן כדי לחזק את המודעות המטא-לשונית של הלומדים והן כדי להראות ללומדים את מגבלות התוכנה.בתרגום מכונה, אפילו מהשפות אנגלית או ספרדית, התוכנה צריכה להיאבק למשל בכינויי גוף שהושמטו - עדיין יכולות להיות טעויות. תוכנות תרגום מתקשות לעיתים קרובות גם בתרגום של מטאפורות ואלגוריות כאשר הנוסח שונה מאוד מהמשמעות המילולית. כמו כן התוכנה לא מוצאת תמיד את הטון הנכון בכל הקשור להקשר, לנמענים ולמשלב הלשוני. ניתן לתת ללומדים לתקן טעויות סמנטיות, דקדוקיות וסגנוניות וכן טעויות של חוסר עקביות בטקסט שמתורגם בתרגום מכונה. פעילות זו עשויה לחזק את המודעות הלשונית שלהם.
אפשר לשלב בקלות מחוללי טקסט מבוססי בינה מלאכותית בשיעורי שפה זרה. מאחר שלמחוללי טקסט אין ידע עולם משלהם, הם מייצרים רצף של מילים המבוסס על נתונים סטטיסטיים. בשל כך התוצרים לא תמיד תואמים את הציפיות מהתוכנה. אמנם למחוללי הטקסט אין בעיה לכתוב סיפור פנטזיה שיש לו עלילה מסוימת, אולם הם יתקשו לחבר טקסטים עיוניים בתחומי ידע מיוחדים. מחוללי טקסט מתקשים גם בסוגיה של סגנון כתיבה. בשיעורי שפה ניתן לעבוד עם טקסטים שנוצרו בתרגום מכונה: אפשר לבקש מהלומדים לתקן את הטקסטים בהיבטים שונים - בין אם המטרה היא להתאים את הטקסטים למשלב או לנמען מסוים או כדי לעמוד בדרישות תוכן מסוימות של כתיבת טקסט עיוני.
מורים יכולים להשתמש במחוללי טקסט כשהם מכינים את השיעור, לדוגמה לצורך הקניית אוצר מילים חדש. אפשר למשל לתת לאלגוריתם נושא מסוים ולמנות כמה מילים שצריכות להופיע בטקסט. האלגוריתם עושה זאת.
דוגמה לטקסט שנוצר בידי OpenAI GPT-3 Playground לצורך הקניית אוצר מילים | © OpenAI לצד היתרונות הברורים, קיים סיכון ממשי לשימוש לרעה בטכנולוגיות. מורים יכולים לפתח אסטרטגיות בשיעורים המאפשרות שימוש אחראי ויעיל בתוכנה מבוססת בינה מלאכותית.
Faes, Florian (2017): Why DeepL Got into Machine Translation and How It Plans to Make Money. Slator – Language Industry Intelligence. Abgerufen am 5. Juli 2022, von https://slator.com/deepl-got-machine-translation-plans-make-money/.
Raveling, Jann (2022): Was ist ein neuronales Netz?. Wirtschaftsförderung Bremen GmbH. Abgerufen am 5. Juli 2022, von https://www.wfb-bremen.de/de/page/stories
/digitalisierung-industrie40/was-ist-ein-neuronales-netz.
Romero, Alberto (2021): Understanding GPT-3 in 5 Minutes. TowardsDataScience. Abgerufen am 5. Juli 2022, von https://towardsdatascience.com/understanding-gpt-3-in-5-minutes-7fe35c3a1e52.
Sciforce (2021): What is GPT-3, How Does It Work, and What Does It Actually Do?. Medium. Abgerufen am 5. Juli 2022, von https://medium.com/sciforce/what-is-gpt-3-how-does-it-work-and-what-does-it-actually-do-9f721d69e5c1.
Smolentceva, Natalia (2018): DeepL: Cologne-based startup outperforms Google Translate. DeutscheWelle. Abgerufen am 5. Juli 2022, von https://www.dw.com/en/d
eepl-cologne-based-startup-outperforms-google-translate/a-46581948.