לדבר עם מכונה: מתי נוכל לנהל שיחה אמיתית עם מחשב?

שנים של התפתחות טכנולוגית לא הועילו; מחשב שמסוגל לבצע אינספור חישובים מורכבים בו זמנית עדיין לא יכול לעשות משהו שילד לומד עד גיל 3: להבין מה שאומרים לו ולענות; מתי נוכל לנהל שיחה אמיתית עם מכונה - והאם זה בכלל אפשרי?

דורון פישלר | 30/10/2011 18:10 הוסף תגובה הדפס כתבה כתוב לעורך שלח לחבר
בסרטים זה נראה קל כל כך. "מחשב, הגבר את המגנים ל-60%, קח אותנו לביטלג'וז ותביא לי פיצה", אומר הקפטן, והמחשב, בקול נשי ונעים - אם כי מונוטוני מעט - אומר "מיד, קפטן. איזה תוספות תרצה על זה?".

ברור, זה מדע בדיוני. מחשבים לא באמת יכולים לדבר. אבל אנחנו מסתכלים על העתיד: מחשבים הרי עושים דברים מדהימים כל כך. הם יכולים אפילו להציג משחקי מחשב - עולם שלם וכמעט פוטוריאליסטי, שמגיב מיד להקשות על המקלדת, וכל אחד ממאות אלפי הפיקסלים על המסך מחושב מחדש על-פי חוקי פיזיקה ותנאי תאורה וירטואליים 30 פעמים בשנייה. זה נראה כמו נס. כמה זה מסובך לאפשר למחשב גם לדבר איתנו?

מסובך מאוד, מתברר. מחשבים התחזקו פי מיליון מאז סטארטרק, ועדיין לא הצליחו לעשות את מה שכל ילד לומד לעשות עד גיל 3: להבין מה שאומרים לו ולענות. וזה לא שהם לא ניסו. תוכנות שיחה שונות פותחו משנות ה-60 ועד היום, והדוגמנית החדשה של התחום היא סירי, התוכנה המדברת שמגיעה עם אייפון 4S. אפשר לדבר עם סירי; היא מבינה מה שאומרים לה (בדרך כלל) ועונה (בקול נשי ונעים). אבל לפתח איתה שיחה של ממש אי אפשר, והדיאלוג איתה מוגבל במידה מתסכלת.
להתחזות לאדם

משום שלמחשב קשה כל כך לנהל שיחת חולין הדבר הפך לנושא למבחן שבודק את הגבול בין חיקוי אינטליגנציה לבין אינטליגנציה אמיתית. את המבחן הגה בשנת 1950 אלן טיורינג, חלוץ המחשוב. המבחן הוא כזה: אדם מצ'וטט עם מחשב. אדם אחר, שקורא את תמליל השיחה, צריך לקבוע על סמך הטקסט בלבד מי מבין הצדדים המשוחחים הוא האדם ומי המכונה. אם המאזין לא מצליח לקבוע זאת בוודאות - מזל טוב, המחשב עבר את המבחן: הוא התחזה בהצלחה לאדם.

טיורינג היה גאון מדהים שתחזיותיו והמודלים שלו על עולם המחשוב - עוד לפני שמחשבים כלשהם התקיימו במציאות-התבררו

כמדויקים להפליא. אבל בתחזית אחת הוא טעה: הוא חזה שעד שנת 2000 מחשבים כבר יעברו את המבחן. אך אף על פי שהתקדמות הטכנולוגיה בתחום המחשבים כבר הגיעה הרבה מעל ומעבר למה שטיורינג חזה, עדיין לא קיימת תוכנה שמסוגלת לעבור את המבחן בעקביות, ולפי הערכות המומחים יידרשו עוד 10 שנים לפחות עד שזה יקרה. תוכנות הצ'ט הלכו והשתפרו מאז, ומבחן טיורינג עדיין נשאר קשה.

ב-1990 הוכרזה מדליית לובנר - מדליית זהב טהור ופרס של 100 אלף דולר ליוצר תוכנת המחשב הראשונה שתעבור את מבחן טיורינג בהצלחה מלאה. הפרס עדיין מחכה.

אינסוף צירופים אפשריים

למה זה קשה כל כך? כי כדי לשוחח צריך לחשוב. מובן מאליו שסירי - כמו כל תוכנת דיבור לפניה - אינה באמת חושבת. כששואלים אותה שאלה כמו "מהי משמעות החיים?" היא מספקת אחת מכמה תשובות שתוכנתו לתוכה מראש. כשהיא לא מזהה שאלה ספציפית, היא מזהה את מבנה המשפט ומגיבה בהתאם: "איך אני מגיע ל..." או "תני לי מפה ל..." יובילו לתצוגת מפה למקום שהוזכר.

גטי אימג'ס.
אייפון 4s עם הסירי - הדבר הקרוב ביותר למחשב מדבר. גטי אימג'ס.
אשליית השיחה

ובכל זאת, ככל שסירי חכמה, אין לה סיכוי במבחן טיורינג: אף אחד לא יטעה לחשוב שמדובר באדם. היא לא יודעת לזהות את כל אינסוף המבנים האפשריים של משפטים ולהתמודד עם הצהרות בלתי צפויות.

אחת הדוגמאות הראשונות והידועות ביותר של תוכנת דיבור היתה אלייזה, שפותחה ב-MIT בשנות ה-60. המודל המפורסם ביותר של אלייזה היה "הפסיכיאטר", שהיה מעין פרודיה על פסיכולוג שמתעקש לא להשתתף בשיחה אלא רק לשאול שאלות מנחות. על המשפט "אני מרגיש עייף" היא היתה עונה "כמה זמן אתה כבר מרגיש עייף?", ועל המשפט "אתמול חלמתי על ציפורים" היתה עונה "ספר לי עוד על ציפורים".

על כל משפט שאת המבנה שלו לא זיהתה היתה מגיבה ב"ספר לי עוד על זה" או "למה אתה חושב כך?". אשליית השיחה היתה יכולה להחזיק מעמד משפטים ספורים, אבל ניסיון לקיים עם אלייזה שיחה של יותר מ-5 דקות מעורר באדם הסביר צורך עז להוריד לה סטירה.

צילום: אי-פי
מסע בן כוכבים. שם נראה פשוט. צילום: אי-פי
מי זו "היא"?

ככל שמספר התשובות המוכנות מראש ומבני המשפטים המוכרים גדול יותר, כך הדמיון לשיחה אנושית רב יותר. אבל אפילו אם נקבעו מראש תגובות אמינות למיליוני משפטים ניתן לתקוע את רוב תוכנות הדיבור באמצעות משפט פשוט אחד: "זה מה שהיא אמרה". למחשב המשפט הזה הוא חידה. מי זו "היא"? מה "זה"? מתי ובאיזה הקשר היא אמרה את זה? והאם בן שיחתך התכוון ברצינות שהיא אמרה את מה שאמרה או שהוא פשוט מצטט את "המשרד"?

תגובה למשפט האחרון לא מספיקה: צריך לזכור גם את כל השיחה שלפני כן, ובה הקשרים אפשריים לכל "היא" "הוא" "זה" ו"שם". סירי , ברוב חוכמתה, מתחילה לעשות את זה: היא זוכרת את המשפטים הקודמים ומתייחסת, אם לא הוצהר במפורש שהכוונה למשהו אחר, למקום, לאפליקציה או לאדם האחרונים שהוזכרו בשיחה.

אבל כאן מגיע החלק הקשה ביותר: כדי לחקות שיחה אנושית צריך גם להבין על מה אנחנו בעצם מדברים. השאלה "שמעת את החדש של קולדפליי?" היא פשוטה וישירה בשיחה בין שני בני אדם, אבל למחשב המשפט הזה כמעט בלתי אפשרי לפיצוח.

ראשית כל, הוא לא נכון תחבירית, ולמחשבים קשה עם זה. הנושא של המשפט אפילו לא מוזכר בו: המה החדש? כדי לפענח את הכוונה המחשב צריך לא רק להבין את המבנה החידתי של המשפט (כמו גם כל מבנה אפשרי של משפט שעשוי להיאמר אי פעם), אלא גם לדעת מהי קולדפליי, מהו בדיוק אלבום, מה הקשר בינהם ולמה אנשים מתכוונים כשהם לא אומרים דברים. ואם בן שיחו ישתעמם ממוזיקה ויתחיל לדבר על כדורגל, ייפתח עולם חדש של מושגים מבלבלים. בקיצור, כדי לחקות אפילו שיחת חולין קצרה יצטרך המחשב להכיר את חוקי הכדורגל כולל הנבדל, את ההיסטוריה של הפופ המודרני, מבנה הפוליטיקה הישראלית בעבר ובהווה, את תולדות תוכניות הריאליטי בארץ ושבחורף קר ובקיץ חם - או בקיצור, מאגר מידע עצום ורב-נושאים, שווה ערך לכל הידע שאדם אמיתי צובר במהלך כל חייו.

ולא מדובר כאן רק במסד נתונים הכולל מיליוני רשומות שניתן להמיר לאפסים ולאחדות, אלא בקשרי גומלין סבוכים ובמאות אלפי סטים של חוקים, שיצירת "הבנה" במחשב לכל אחד מהם בנפרד היא אתגר עצום. בקיצור: כדי לנהל שיחה פשוטה אחת עם מחשב, אותו מחשב צריך לעבוד כמו מוח אנושי.

לא סתם תוכנה

וזו, בעצם, היתה בדיוק הנקודה של טיורינג. את המבחן הקרוי על שמו הציע טיורינג כתחליף לשאלה האבסטרקטית "האם מכונות יכולות לחשוב?". הגדרת "מחשבה", לטענתו , היא מופשטת מדי ושייכת יותר לפילוסופיה מאשר למדעי המחשב. לטענתו, המבחן יוכל לשמש תחליף הולם לשאלה זו. אם נגיע למצב שמחשב יוכל לחקות באופן מושלם יצור אינטליגנטי, החיקוי כבר לא יהיה חיקוי אלא הדבר האמיתי. זו לא תהיה סתם תוכנה, אלא אינטליגנציה מלאכותית. כשתוכלו לדבר עם סירי בחופשיות על כדורגל, על "מאסטר שף" ועל גלעד שליט, היא תהיה ישות חושבת שקיימת בדיוק כמוכם.

כל המבזקים של nrgמעריב לסלולרי שלך

תגובות

טוען תגובות... נא להמתין לטעינת התגובות
מעדכן תגובות...

מדורים

  

פורומים

כותרות קודמות
כותרות נוספות
;
תפוז אנשים