תינוק סם נלקח מדי שבוע במשך שנה וחצי למפגש מיוחד: הוא חבש מצלמת ראש שתיעדה את כל עולמו במשך שעתיים רצופות. כפית נדחפת אל פיו, מטפלת צוהלת בזמן שהוא גולש במגלשה כתומה, משחק עם חתול שמתלקק לו. מדענים הזינו את מה שראה ושמע אל תוכנת בינה מלאכותית פשוטה יחסית, כדי לחקור את אחת השאלות העמוקות ביותר במדעי ההכרה: כיצד ילדים לומדים שפה? במאמר שפורסם בשבוע שעבר בכתב העת סיינס, חוקרים באוניברסיטת ניו־יורק דיווחו שכאשר מזינים לבינה מלאכותית רק חלק קטנטן מהחוויות המקוטעות של ילד אחד, היא יכולה להתחיל לסדר את הפיקסלים, ללמוד מהם עריסה, מדרגות או פאזל, ולהתאים את המילים הללו לתמונות הנכונות.
הבינה המלאכותית לא לומדת ממש כמו ילד, אך המחקר מראה שהיא יכולה לפענח את יסודות השפה דרך מה שקלטו חוש הראייה והשמיעה של תינוק אחד, בלי כל ידע מקדים בלשון או יכולות חברתיות אחרות. זהו חלק אחד ממסע גדול הרבה יותר, שמטרתו הסופית היא לבנות בינה מלאכותית שמחקה בדיוק את מוחו של תינוק. הישג כזה יוכל לסייע לחוקרים להבין את ההתפתחות האנושית ולהוביל ליצירת בינה מלאכותית שבני אדם יוכלו ללמד אותה יכולות חדשות באופן אינטואיטיבי הרבה יותר.
"מודלים של שפה גדולה" כמו GPT הדגימו לאחרונה שבינה מלאכותית שלמדה כמויות ענק של טקסטים יכולה להשתתף בשיחה עם בני אדם תוך הפגנת שליטה מרהיבה בשפה. אך חוקרי הכרה רבים טוענים שההצלחה המילולית הזאת אינה מגיעה לכדי חשיבה אנושית ולמידה אמיתית. תינוקות, בניגוד למודלים הללו, לומדים מילים לא דרך עיכול מתמשך של כל הטקסטים בעולם, אלא דרך חוויית העולם עצמו באמצעות קליטה חושית ומשחק. "לפי החישובים שלנו, יידרשו 100 אלף שנים של האזנה מתמשכת למילים מדוברות כדי שילדים יגיעו למספר המילים ששימשו לחינוך הבוטים", אומר ברנדן לייק, חוקר קוגניציה חישובית באוניברסיטת ניו־יורק שהוביל את המחקר. "אני מפקפק בכך שהמודלים הללו יסייעו לנו ללמוד על לימוד והתפתחות אנושית".
חיקויי למידה
בלשנים, פילוסופים, מדעני קוגניציה וגם מפתחי בינה מלאכותית מבקשים לדעת כיצד בני אדם לומדים שפה. במשך שנים, מדענים ניסו להבין כיצד מוחותיהם של ילדים מתעצבים באמצעות ניסויים מבוקרים בקפידה. רבים מהניסויים כללו צעצועים או בובות שאפשרו לחוקרים לבדוק מתי מיומנויות קוגניטיביות מתחילות לתפקד. כבר בגיל 16 חודשים, מתברר, תינוקות יכולים להפעיל חשיבה סטטיסטית כדי לקבוע אם צעצוע שמייצר רעש מקולקל; תינוקות בני פחות מחמישה חודשים יודעים שעצם עדיין קיים גם כשהם לא יכולים לראות אותו – אבן דרך מרכזית בהתפתחות, שמכונה "קביעוּת אובייקט".
תינוקות, בניגוד למודלים של בינה מלאכותית, לומדים מילים דרך חוויית העולם עצמו באמצעות קליטה חושית ומשחק. "יידרשו 100 אלף שנים של האזנה מתמשכת למילים מדוברות כדי שילדים יגיעו למספר המילים ששימשו לחינוך הבוטים"
במחקרים מסוימים, החוקרים הציבו תינוקות תחת מעקב צמוד לאורך זמן. דב רוי, מדען במכון הטכנולוגי של מסצ'וסטס (MIT), התקין מצלמות תקרה בכל חדרי ביתו בשנת 2005 ותיעד את ההתפתחות הלשונית של בנו, במחקר שסיפק אוסף עצום של נתונים המתעדים את הרכישה וההתפתחות של מילים. המחקר גילה שמה שקבע אילו מילים ילמד בנו של רוי בשלב מוקדם לא היה כמה פעמים הוא חזר על המילה, אלא האם היא נאמרה במקום לא שגרתי בבית, בזמן מפתיע או בהקשר לשוני ייחודי.
השימוש החדשני במצלמות ראש העניק לחוקרים מבט אינטימי עוד יותר על הגיל הרך. מאז 2013 תרמו כמה משפחות למסד הנתונים SAYCam, אוסף של הקלטות תמונה וקול מתינוקות ופעוטות לאורך תקופה מכרעת של ההתפתחות הקוגניטיבית, בין גיל חצי שנה לגיל 32 חודשים. משפחות התינוקות התקינו מצלמות על ראשי ילדיהם (שזוהו במחקר רק בשמותיהם הפרטיים) במשך כשעתיים בשבוע. מדענים יכולים לבקש גישה לנתונים, כדי לפתוח לעצמם צוהר ייחודי לעולמו של כל ילד לאורך זמן. התיעוד אמור לשמש משאב לחוקרים במגוון תחומים.
התינוק סם כבר בן 11 היום, אבל ההקלטות של שנותיו הראשונות באוסטרליה סיפקו ללייק ולעמיתיו 600 אלף תמונות ו־37,500 מילים מתומללות, ששימשו כדי לאמן את הבינה המלאכותית שלהם. הם אימנו באמצעותן את הרשת העצבית הפשוטה יחסית שלהם, והבינה המלאכותית למדה להתאים שמות עצם ותמונות בסיסיות. הישגיה היו דומים לאלו של תוכנה שאומנה באמצעות 400 מיליון תמונות עם כיתובים שנאספו מהרשת.

התוצאות מביאות תובנה ייחודית – אך לא מכרעת – במסגרת ויכוח מדעי ממושך על מיומנויות ההכרה הבסיסיות שבני אדם זקוקים להן כדי ללמוד שפה. יש מגוון הצעות לגבי לימוד השפה האנושי. הבלשן המפורסם נועם חומסקי הציע שיכולת השפה מובנית ומולדת. מומחים אחרים חושבים שאנחנו צריכים כישורי חשיבה חברתית או אינדוקטיבית כדי שהשפה תופיע. המחקר החדש מעיד שלמידת שפה מסוימת יכולה להתרחש בהיעדר יכולות קוגניטיביות מיוחדות. למידה אסוציאטיבית פשוטה יחסית – לראות כדור, לשמוע "כדור" – יכולה ללמד בינה מלאכותית שמות עצם ודימויים פשוטים.
"אין שום דבר מובנה ברשת העצבית שלנו שנתן למודל רמזים לגבי השפה והמבנה שלה", אומר מחבר המחקר ואי קין וונג, מדען באוניברסיטת ניו־יורק. החוקרים נתנו לבינה המלאכותית משימות, ולדבריהם הם נופלים מיכולותיו של ילד קטן (אף שאין להם נתוני השוואה ליכולת של ילד בן שנתיים, למשל, בביצוע המשימות הללו). לדוגמה, הם בדקו במה הבינה המלאכותית מתמקדת כשמשמיעים לה מילים מסוימות, וגילו שהיא דייקה במילים כמו "מכונית" או "כדור", אך הסתכלה לאזור הלא נכון כששמעה "חתול". "אני רוצה לגלות את המרכיבים המזעריים הדרושים לבניית מודל שיכול ללמוד יותר כמו ילד", אומר לייק. "זה צעד ראשון".
יסודות השפה
הבינה המלאכותית בנתה את אוצר המילים שלה בחשיפה לאחוז אחד משעות הערות של סם – 61 שעות של צילומים במשך שנה וחצי. בהתבסס על זה היא הרחיקה לכת, אבל חוקרים רוצים להבין כמה רחוק צריך ללכת כדי לשחזר את הלמידה האנושית. "חשוב ליישם את השיטות האלה על מסד נתונים כזה, תיעוד החוויה של ילד יחיד מבחינה חזותית וקולית", אומר ג'ושוע טננבאום, מדען קוגניציה חישובית ב־MIT שלא היה מעורב במחקר. "עדיין יש כמה דברים שקשה יותר להסיק מהמאמר. מה זה אומר לנו על אופן הלימוד של ילדים? זה פחות ברור".
מומחים חושבים שאנחנו צריכים כישורי חשיבה חברתית או אינדוקטיבית כדי שהשפה תופיע. המחקר מעיד שלמידת שפה יכולה להתרחש בהיעדר יכולות קוגניטיביות מיוחדות. למידה אסוציאטיבית פשוטה – לראות כדור, לשמוע "כדור" – יכולה ללמד בינה מלאכותית שמות עצם ודימויים פשוטים
מייקל טומאסלו, פסיכולוג בתחום ההתפתחות באוניברסיטת דיוק, אומר שמודל הבינה המלאכותית עשוי לשקף כיצד כלב או תוכי יכולים ללמוד מילים. ניסויים מראים שכלבים מסוימים יכולים ללמוד יותר ממאה מילים לחפצים נפוצים או לצעצועים. אבל לדבריו עוד לא ברור כיצד הבינה המלאכותית יכולה לקבל קלט חושי וללקט פעלים, מילות יחס או ביטויים חברתיים. "היא יכולה ללמוד שדפוס ויזואלי חוזר הוא 'בובה'. אבל איך היא לומדת שאותו החפץ בדיוק הוא גם 'צעצוע'?", תוהה טומאסלו. "איך היא לומדת מילים כמו 'זה' או 'כזה' או 'דבר'?"
מודל הבינה המלאכותית הצליח לזהות דברים שאפשר לראות, וזה רק חלק קטן מהשפה. טומאלו מציע מודל חלופי: במקום לקשר תמונות לצלילים, בינה מלאכותית תצטרך להסיק מסקנות לגבי כוונת התקשורת וללמוד מכך שפה. לייק מתחיל לאמן מודלים של בינה מלאכותית בווידאו במקום בצילומים, כדי לראות אם התיעוד בווידאו מצליח להרחיב את אוצר המילים של הבינה המלאכותית לפעלים ולמילים מופשטות. בקרוב יהיה מאגר נתונים נוסף לעבוד איתו, כי לייק אוסף נתונים מבתו הצעירה.
אבל הוא מודה שבינה מלאכותית לומדת אחרת מילדים, אפילו במילים פשוטות. הבינה המלאכותית מזהה בקלות חול, למשל, אבל יש לה בעיה בזיהוי ידיים, מה שאומר שההתקדמות שלה כנראה לא משקפת את התפיסה של רוב הילדים. "'חול' היה קל מדי, 'יד' הייתה קשה מדי", אומר לייק. "והבינה המלאכותית לא יודעת שחלב ואגסים הם טעימים".
לתגובות: dyokan@makorrishon.co.il