הבינה המלאכותית מתקדמת באופן שקשה למוח האנושי לתפוס. כלום לא קורה במשך הרבה זמן, ואז פתאום קורה משהו ענק. המהפכה הנוכחית, המבוססת על "מודל שפה גדולה" (LLM) כמו ChatGPT, נבעה מהופעתן של "רשתות עצביות משתנות" בערך בשנת 2017. מה יביא חצי העשור הבא? האם נוכל להסתמך על ההתרשמות הנוכחית שלנו מהכלים הקיימים כדי לשפוט את איכותם, או שהם יפתיעו אותנו בקצב ההתפתחות?
כמי שבילה שעות רבות במשחק עם הדגמים האלה, אני חושב שאנשים רבים יהיו בהלם. ל־LLM יהיו השלכות גדולות על ההחלטות העסקיות שלנו, על תיקי ההשקעות שלנו, על המבנים הרגולטוריים שלנו ועל השאלה הפשוטה כמה אנחנו כיחידים צריכים להשקיע בלמידה כיצד להשתמש בהם.
אבהיר שגישתי אינה סנסציונית בכל הקשור לבינה מלאכותית. איני חושב שהיא תוביל לאבטלה המונית, ועל אחת כמה וכמה אני מפקפק בתרחיש השמדת עולם רובוטית בסגנון "שליחות קטלנית". אני כן חושב שהבינה המלאכותית תתגלה כיתרון תחרותי וחינוכי מתמשך לאנשים ולמוסדות שיוכלו לעשות בה שימוש נכון.
יש לי סיפור בשבילכם, על שחמט ועל מיזם הרשת העצבית "אלפאזירו" בחברת "דיפמיינד". רשת אלפאזירו הושקה בסוף 2017. כמעט מיד היא החלה להתאמן כששיחקה מאות מיליוני משחקי שחמט מול עצמה. לאחר כארבע שעות היא כבר הייתה הישות השחמטאית הטובה ביותר שנוצרה אי פעם. הלקח של הסיפור: בתנאים הנכונים, בינה מלאכותית יכולה להשתפר במהירות רבה מאוד.
מודלים של שפה לא יכולים להתקדם בקצב הזה, כיוון שהם מתמודדים עם מערכות פתוחות ומורכבות יותר, וגם דורשים השקעה מתמשכת של החברות האחראיות עליהם. ובכל זאת, ההתקדמות שהופגנה לאחרונה הייתה מרשימה. לא התרגשתי מ־GPT-2, המודל שהושק ב־2019. הסתקרנתי מ־GPT-3 שהושק ב־2020 והתרשמתי מאוד מ־ChatGPT, שלעתים נקרא GPT-3.5, שהושק בסוף השנה שעברה. GPT-4 בדרך אלינו, וייתכן שינחת כבר במחצית הראשונה של השנה. בתוך שנים ספורות, המודלים הללו הפכו מתופעה מסקרנת לחלק בלתי נפרד משגרת העבודה של אנשים רבים שאני מכיר. במהלך הסמסטר הזה אלמד את התלמידים שלי כיצד לכתוב עבודה באמצעות תוכנות LLM.
ChatGPT, שהושק בסוף השנה שעברה, קיבל ציון נכשל בבחינה שחיבר עמיתי בריאן קפלן במסגרת תואר ראשון בכלכלת עבודה. אך "אנתרופיק", מודל חדש שזמין בגרסת בטא וצפוי להיפתח לציבור במהלך השנה, עבר את הבחינות שלנו במשפטים וכלכלה ברמת תואר שני עם תשובות יפות וברורות (אם תהיתם, המבחן נבדק ללא ידיעה שהעונה הוא מחשב). נכון, רבים מהביצועים הנוכחיים של הבינה המלאכותית המתקדמת הזמינה לא תמיד מרשימים. אבל זכרו את הדוגמאות הללו. זכרו את אלפאזירו.
אין לי תחזית לקצב השיפור, אך רוב האנלוגיות הכלכליות הרגילות לא מתאימות. מכוניות, כמו רוב הדברים האחרים שאנחנו קונים, משתפרות בקצב צנוע בכל שנה. לעומת זאת, מודלים של בינה מלאכותית מתקדמים בזינוקים. ובכל זאת, אולי אתם תוהים: מה LLM יכולים לעשות בשבילי? יש לי שתי תשובות מיידיות.
ראשית, הם יכולים לכתוב קוד תוכנה. אכן, הם עדיין עושים טעויות רבות, אבל קל יותר לערוך ולתקן את הטעויות האלה מאשר לכתוב את הקוד מאפס. הם גם נוטים להיות שימושיים ביותר בכתיבת החלקים המשעממים של הקוד, ומשחררים מתכנתים אנושיים מוכשרים לניסויים ולחדשנות.
שנית, הם יכולים להיות מורים. מודלים כאלה כבר קיימים, והם יכולים לתת תשובות מעניינות מאוד לשאלות על כל דבר כמעט בעולם. הם לא תמיד אמינים, אבל הם שימושיים כמחוללי רעיונות חדשים והשראה, לא לבדיקת עובדות. אני מצפה שהם ישולבו עם שירותי בדיקת עובדות וחיפוש בקרוב. בינתיים, הם יכולים לשפר כתיבה ולארגן נקודות לדיון.
התחלתי לחלק אנשים שאני מכיר לשלושה מחנות: אלה שעדיין לא מודעים למודלים הללו; אלה שמתלוננים על המודלים הנוכחיים; ואלה שיש להם מושג כלשהו לגבי העתיד המדהים שלפנינו. הדבר המסקרן בבינה המלאכותית הוא שהמודלים אינם פועלים לפי כללי פיתוח ברורים. הם יותר כמו זחלים שהופכים פתאום לפרפרים.
אנושי לחלוטין לחשוש מהעתיד הזה. אבל כדאי שנהיה מוכנים אליו.