וסי גץ, תלמידת י"ב, קיבלה ציון מרבי על חיבור מקורי שכתבה על סוציאליזם. תארו לעצמכם כמה היא הופתעה כשסיפרתי לה שתוכנה חינוכית חדשה טוענת שהיא נעזרה בבינה מלאכותית. אמצעי חדש לגילוי כתיבה של בינה מלאכותית, בפיתוחה של חברת "טורניטין", כבר משמש 2.1 מיליון מורים כדי לזהות חיבורים שכתבה בינה מלאכותית – והוא סימן את החיבור שלה בטענה שסופו נכתב על ידי ChatGPT. אבל גץ נשבעת שלא השתמשה במנוע בינה מלאכותית כדי לרמות.
אחרי שהמורים התלוננו במשך חודשים שיש תלמידים שמשתמשים באתרי בינה מלאכותית שיכולים להפיק מאמרים ולהשלים מטלות, כעת הם מקבלים טכנולוגיית בינה מלאכותית משלהם. התוכנה, שמנתחת כל משפט במטלות של תלמידים במטרה לזהות שימוש בבינה מלאכותית, פועלת כיום בכ־10,700 מוסדות חינוך תיכוניים וגבוהים. מורים רבים שמחים על קיומה של תוכנה יעילה לזיהוי בינה מלאכותית, במטרה להרתיע את הרמאים.
"כתיבת בינה מלאכותית היא הצורה הסבירה ביותר של כתיבה אנושית", מסביר ואנג, ותוכנת הגילוי של טורניטין "מזהה מתי הטקסט ממוצע באופן עקבי מדי".
אך בינה מלאכותית לבדה לא תפתור את הבעיה שיצרה בינה מלאכותית. הסימון של סוף מאמרה של גץ היה חריג, אבל מראה שתוכנות גילוי כאלה יכולות לפעמים לטעות – וההשלכות הרות אסון. מלבד זאת, טכנולוגיית הבינה המלאכותית מתקדמת במהירות כזאת שכל תוכנת זיהוי כנראה תהיה לא רלוונטית בתוך זמן קצר.
זהו רגע מכריע למערכות החינוך וההשכלה הגבוהה שלנו: אם המורים יתעלמו מהבינה המלאכותית הרמאות עלולה לצאת משליטה; אבל אפילו בכירים בטורניטין אומרים לי שההתייחסות לבינה מלאכותית כאל אויב בטווח הארוך דומה לניסיון לאסור שימוש במחשבונים. לקראת השקת תוכנת הגילוי שלה, החברה אמרה ש־2 אחוזים מהלקוחות שלה ביקשו שהתוכנה לא תסמן כתיבת בינה מלאכותית במטלות של תלמידים, ובהם נכללו "רוב משמעותי" של האקדמיה בבריטניה – שכנראה מוכנה להתמודד עם השימוש בכלי החדש.
כדי להבין מה מונח על כף המאזניים, ביקשתי מטורניטין גישה מוקדמת לתוכנה שלה. חמישה תלמידי תיכון, כולל גץ, התנדבו לעזור לי לבדוק אותה באמצעות יצירת 16 דוגמאות של חיבורים – חלקם אמיתיים, חלקם מופקים בבינה מלאכותית וחלקם ממקורות מעורבים. התוצאה? הכלי של טורניטין טעה לפחות באופן חלקי ביותר ממחצית מהחיבורים. התוכנה זיהתה במדויק שישה מתוך 16, אך נכשלה בשלושה. היא סימנה ככתיבת בינה מלאכותית 8 אחוזים מהמאמר המקורי של גץ. על שבעת החיבורים הנותרים הייתי נותן לה ציון חלקי בלבד: היא צדקה באופן עקרוני אבל לא זיהתה נכון חלקים שנכתבו באמצעות בינה מלאכותית או שכללו כתיבה מעורבת.
טורניטין טוענת שלפי ניסויים שלה, תוכנת הגילוי מדויקת ב־98 אחוזים, ומה שקרה עם החיבור של גץ קורה בפחות מאחוז אחד מהמקרים. היא הוסיפה שיש להתייחס לציונים של הגלאי כאינדיקציה, לא כהרשעה. ובכל זאת, האם מיליוני מורים יבינו שעליהם להתייחס כך להערות של התוכנה? לאחר שיחותיי עם החברה, היא הוסיפה אזהרה לציון שמפיקה התוכנה: "ייתכן שציון חלקי לא מעיד על רמאות. נדרשת בדיקה".
"התפקיד שלנו הוא להצביע על כיוון, כדי שהמורה יוכל להניע שיח", אומרת לי מנהלת המוצר הראשית של טורניטין, אני צ'צ'יטלי. "אני בטוחה מספיק להוציא את התוכנה לשוק, כל עוד אנחנו ממשיכים ללמד מחנכים כיצד להשתמש בנתונים". היא אומרת שהחברה תמשיך לשדרג את התוכנה שלה על סמך משובים ובהתאם לשכלולים החדשים במנועי הבינה המלאכותית.
השאלה היא אם זה יספיק. "העובדה שהמערכת של טורניטין לא תמיד עובדת היא מדאיגה", אומרת רבקה דל, המורה לאנגלית של גץ בקונקורד בקליפורניה. "אני לא בטוחה שבתי ספר יוכלו להשתמש בתוכנה כראיה ברורה נגד תלמידים שמגישים עבודה לא מקורית".
בניגוד להאשמות קלאסיות בהעתקה, במקרה של טקסטים שחוללה בינה מלאכותית אין דרך להשוות חיבור למקור. "זה פותח דלת להטיה מצד המורים", מוסיפה דל. מבחינת התלמידים, האפשרות שהם יואשמו בשימוש בבינה מלאכותית מפחידה במיוחד. "אין דרך להוכיח שלא רימית, אלא אם המורה שלך מכירה את סגנון הכתיבה שלך, או סומכת עלייך כתלמידה", אומרת גץ.

גניבה
איתור כתיבת בינה מלאכותית אינו פשוט כל כך. כשעמית שלי ביקש לבחון לאחרונה אם אני יכול לזהות את ההבדל בין מיילים אמיתיים לכאלו שחולל ChatGPT, לא כל כך הצלחתי. זיהוי כתיבת בינה מלאכותית באמצעות תוכנה כרוך בסטטיסטיקה, ובאופן סטטיסטי הבינה המלאכותית "ממוצעת באופן עקבי ביותר", אומר אריק ואנג, סמנכ"ל בינה מלאכותית בטורניטין.
מערכות כמו ChatGPT עובדות כמו גרסה מתוחכמת של השלמת מילים אוטומטית: בכל פעם הן מחפשות את המילה שהכי סביר שתיכתב אחרי הקודמת. "זו הסיבה לכך שהתוצרים שלה נראים טבעיים כל כך: כתיבת בינה מלאכותית היא הצורה הסבירה ביותר של כתיבה אנושית", מסביר ואנג. תוכנת הגילוי של טורניטין "מזהה מתי הטקסט ממוצע באופן עקבי מדי".
הבעיה היא שלעיתים, כותב אנושי עשוי גם כן להיות ממוצע באופן עקבי. במטלות בכלכלה ובמתמטיקה ובדו"חות מעבדה, תלמידים נוטים למלא אחר סגנונות קבועים, כלומר יש סיכוי גבוה יותר שהכתיבה שלהם תסומן בטעות ככזו שנוצרה בבינה מלאכותית, אומר ואנג. זו כנראה הסיבה לכך שטורניטין סימנה בטעות קטע שעסק בכלכלה בחיבור של גץ.
לדברי ואנג, טורניטין מכווננת את המערכות שלה כך שיידרש יותר ביטחון כדי לקבוע שמשפט נוצר באופן מלאכותי. ראיתי את התהליך הזה מתפתח בזמן אמת: בדקתי לראשונה את החיבור של גץ בסוף ינואר, והתוכנה זיהתה בערך את מחציתו כתוצר של בינה מלאכותית. כשטורניטין העבירה את החיבור במערכת שלה שוב בסוף מרץ, היא סימנה רק 8 אחוזים.
התוצאה היא שהתוכנה זהירה, ובמקרים מסוימים זהירה מדי. כשהעברתי את הדגימות לבחינתה בסבב נוסף, היא פספסה כמה מקרים של כתיבת בינה מלאכותית. "אנחנו באמת מנסים לשים דגש על בטיחות התלמידים", אומרת צ'צ'יטלי.
התוכנה אכן מתפקדת טוב יותר מתוכנות אחרות בשוק. אחת מהן, שהושקה בפברואר בידי OpenAI (החברה שפיתחה את ChatGPT), טעתה בשמונה מתוך 16 דגימות הבדיקה שלנו. תוכנות גילוי אחרות "נכשל באופן מרהיב" לפי בדיקות שערכו אחרים.
התוכנה של טורניטין מתמודדת עם מגבלות טכניות גדולות. היא זיהתה היטב טקסטים שהופקו לחלוטין באמצעות בינה מלאכותית או היו כתיבה אנושית בלבד. אבל כשבדקתי חיבורים מעורבים, לעיתים קרובות היא טעתה בזיהוי החלקים שנכתבו בידי אדם, או פספסה אותם לחלוטין. היא גם לא הצליחה לזהות את הבינה המלאכותית בחיבורים שהעברנו דרך Quillbot, תוכנת ניסוח שכותבת מאמרים מחדש.
יתרה מכך, ייתכן שהגלאי של טורניטין כבר מפגר מאחורי מנועי הבינה המלאכותית. התלמידים שסייעו לי חוללו חיבורים עם ChatGPT, אבל מאז שהם עשו זאת המנוע התעדכן לגרסה 4, בעלת יכולות יצירתיות וסגנוניות נרחבות יותר. גוגל גם השיקה מנוע בינה מלאכותית משלה, "בארד". לדברי ואנג, החברה פועלת לעמוד בקצב של העדכונים הללו.
כמה מומחי בינה מלאכותית טוענים שכל מאמצי הגילוי הם במקרה הטוב מרוץ חימוש בין רמאים לגלאים. "אני לא חושב שתוכנת גילוי כלשהי תוכל להיות אמינה לטווח ארוך", אומר ג'ים פאן, מדען בינה מלאכותית ב־Nvidia שעבד בעבר ב־OpenAI ובגוגל. "הבינה המלאכותית תשתפר, ותכתוב בצורה אנושית יותר. אפשר לומר בביטחון שכל המוזרויות הקטנות האלה של מחוללי טקסטים ילכו וייעלמו עם הזמן".
האם זה רעיון טוב?
בהתחשב בסיכוי לטעות, מדוע להשיק גלאי בינה מלאכותית שישפיע על כל כך הרבה תלמידים? "מורים רוצים הרתעה", אומרת צ'צ'יטלי. הם חוששים מאוד מהשפעת הבינה המלאכותית, ותוכנת הגילוי עשויה לעזור להם להבין את הממדים האמיתיים של התופעה ובכך "להוריד את גובה הלהבות".
אבל יש מחנכים שחוששים שתוכנות הגילוי רק יגבירו את אש. מיטשל סולנברגר, הממונה על החינוך הדיגיטלי באוניברסיטת מישיגן־דירבורן, ביקש מטורניטין לא להפעיל את זיהוי הבינה המלאכותית; הוא חושש מסימונים כוזבים. גם אם התוכנה תסמן באופן שגוי חלק קטן מ־20 אלף המטלות שסטודנטים שלו מגישים בכל סמסטר, היא עלולה להוביל לחקירות אקדמיות חסרות בסיס.
איאן לינקטר, ספרן טכנולוגיה מתפתחת וחינוכית פתוחה במכון הטכנולוגי של בריטיש קולומביה, אומר שהניסיון לפתח תוכנות גילוי לבינה מלאכותית מזכיר לו את הוויכוח על הבחינות מרחוק במהלך מגפת הקורונה. "אני חושש שהם משווקים את התוכנה כמוצר מדויק, אבל משתמשים בשפה מפוקפקת כשהם טוענים שלא אמורים להשתמש בה כדי לקבל החלטות", אומר לינקטר. "הם עובדים בקצב מואץ לא כי יש דחיפות אמיתית להשיק את המוצר, אלא כי הם חוששים שהמוצר הקיים שלהם מתיישן". צ'צ'יטלי אומרת בתגובה: "אנו מחויבים לשקיפות מול הקהילה ואנו ברורים לגבי הצורך להמשיך לפתח את חוויית המשתמש ככל שאנו לומדים יותר מתלמידים וממחנכים".
דבורה גרין, מנהלת חברת למידה מרחוק בבריטניה, מבינה ומעריכה את המניעים של טורניטין, אבל אומרת ש"דרוש לנו זמן כדי להיות בטוחים בדיוק, באמינות ובמיוחד בהתאמה של כל כלי מהסוג הזה".
עוד לא ברור כיצד ישתלבו תוכנות גילוי כאלה בעתיד הבינה המלאכותית בחינוך. "בחלק מתחומי החקר האקדמיים, כלי בינה מלאכותית כבר משמשים בכיתה ובהערכה", אומרת גרין. "ההשקפה המתגבשת באוניברסיטאות רבות בבריטניה היא שכאשר הבינה המלאכותית כבר משמשת במקצועות ובתחומי עסקים, סטודנטים צריכים לפתח את כישורי החשיבה הביקורתית והמיומנויות לשימוש נכון בבינה המלאכותית".
יש דרכים עדינות לשימוש בבינה מלאכותית, שתוכנות הגילוי אינן יכולות לזהות. בין המטלות שהפיקו התלמידים שלי היה חיבור מקורי שנכתב בספרדית, ולאחר מכן תורגם לאנגלית בעזרת ChatGPT. במקרה כזה, מה נחשב: הרעיונות או המילים? מה יעשו במקרה של תלמיד שמתקשה עם אנגלית כשפה שנייה? ומה אם תלמיד יבקש מ־ChatGPT לשרטט את כל הרעיונות למטלה, ואז יכתוב את המילים בעצמו? "זו השיחה הכי מעניינת והכי חשובה שנקיים בזמן הקרוב", אומרת צ'צ'יטלי. ואנג חושב שהשיחה צריכה להתמקד ב"נראות, שקיפות ויושרה".
עבור רבקה דל, המורה מקליפורניה, היסוד לבינה מלאכותית בכיתה שלה הוא שיח פתוח עם התלמידים. כאשר ChatGPT עלה לכותרות לראשונה בדצמבר, דל העבירה שיעור שלם על בינה מלאכותית ועל שימושים נכונים ולא נכונים בה. היא ביקשה מ־ChatGPT לחבר טקסט בהתאם למטלה שהתלמידים שלה כבר השלימו בעצמם, ואז הכיתה כולה ניתחה אותו. הבינה המלאכותית לא הייתה מוצלחת במיוחד. "שכנוע התלמידים לא לרמות כרוך גם בהדגשה שמה שאנחנו מבקשים מהם לעשות חשוב להם", אמרה דל.
לתגובות: dyokan@makorrishon.co.il
עשר עצות מהבינה המלאכותית על החינוך בעידן הבינה המלאכותית
שאלנו את ChatGPT איך מורים ומנהלי בתי ספר צריכים להתמודד עם היכולת של התלמידים להשתמש בו
- הבנת השינויים: מערכת החינוך צריכה לקבל את העובדה שבינה מלאכותית היא חלק מהמציאות החדשה של תלמידים, ולפעול בהתאם. חשוב להבין שהשימוש בבינה מלאכותית עשוי לשפר את יכולות התלמידים, אך ייתכן גם שיהיו לו השלכות שליליות על תהליך הלמידה.
- מבחנים מבוססי מיומנויות: מערכת החינוך צריכה לשנות את התפיסה המסורתית של מבחנים ולהתמקד יותר בהערכת מיומנויות וביכולות של התלמידים במקום במידת הידע שלהם בצורה טכנית. כך אפשר להעריך את היכולת האמיתית של התלמידים.
- למידה מעשית וחוויתית: כדי להקשות על התלמידים לרמות במבחנים, יש לקדם את הכיוון של למידה מעשית וחווייתית שבה תלמידים משתתפים בפעילויות, מיזמים ומחקרים שמטרתם להעמיק את הידע המתקבל מן השיעורים התיאורטיים.
- הכשרת מורים: יש להכשיר את המורים להבין את השימושים השונים בבינה מלאכותית וללמד איך להתייחס אליהם בהקשר החינוכי. יש להכשיר מורים כך שידעו לייעץ לתלמידים כיצד להשתמש בטכנולוגיה בצורה חכמה ויעילה, כדי שיתמקדו בפיתוח יכולות החשיבה היצירתית, הביקורתית והתיאורטית.
- שיתוף פעולה בין בתי ספר: על בתי הספר לשתף פעולה ולחלוק ניסיון וידע בנושא הבינה המלאכותית וההשלכות שלה על הלימודים והמבחנים. שיתוף הפעולה יאפשר למערכת החינוך להתמודד עם קצב השינויים הטכנולוגיים ולהגיב להם באופן מתאים.
- פיתוח טכנולוגיות מבחן מתקדמות: על מערכת החינוך להשקיע בפיתוח טכנולוגיות בדיקה חדשות, שייצרו מבחנים מותאמים אישית לכל תלמיד ויאפשרו להעריך בצורה טובה יותר את רמת ההבנה והיכולות האמיתיות של תלמידים, תוך הכשרת המורה לגילוי רמאות בעזרת בינה מלאכותית.
- התמקדות בשיח המוסרי: על מורים לדבר עם התלמידים על נושאים מוסריים, כמו יושרה, כנות ואחריות. הדיון בתכלית הלמידה ובאחריות האישית של התלמידים עשוי לעזור להם להבין את ההשלכות של השימוש בבינה מלאכותית לצורך רמאות ולעודד אותם לפעול ביושר.
- שיתוף פעולה עם ההורים: מערכת החינוך צריכה לעבוד יחד עם ההורים במאבק נגד רמאות במבחנים ולהבין את התפקיד החשוב שלהם בתהליך החינוך. יש להעריך את התמיכה שההורים מספקים לתלמידים ולייעץ להם כיצד להתמודד עם האתגרים הטכנולוגיים.
- חשיבה יצירתית: עידוד התלמידים להשתמש בחשיבה יצירתית ובפתרון בעיות מקורי עשוי להקטין את המוטיבציה לרמות במבחנים. ככל שהתלמידים יתרגלו להשתמש ביכולותיהם האישיות ולבטא את עצמם באופן ייחודי, יפחת הסיכוי שיחליטו להיעזר בבינה המלאכותית למטרות רמאות.