גוגל טרנסלייט מאפשר לך לתרגם כל שפה - רק לא בטוח שיבינו אותך

גוגל טרנסלייט הולך ומשתפר - ורבים מאמינים שבקרוב ינפץ את מחסומי השפה בעולם ויהפוך אותו לקטן יותר. מומחים אחרים טוענים שיש דברים שאפילו גוגל לא יכולה לעשות - ומדובר בתרגום מכני שלא יאפשר הבנה של דקויות. ויכוח שאובד בתרגום

טים אדמס | 30/12/2010 19:30 הוסף תגובה הדפס כתבה כתוב לעורך שלח לחבר
תגיות: גוגל
אם תריצו את משפט הפתיחה של "אנה קרנינה" - אחד המשפטים המפורסמים ביותר בספרות - בגוגל טרנסלייט, ותבקשו תרגום שלו מרוסית לאנגלית, תקבלו את התרגום הכי קרוב שיכול להיות לתרגום "אנושי" של המשפט. זה בהחלט נראה כמו ניצחון למה שנקרא פעם בינה מלאכותית והיום (בקצת יותר צניעות) למידה חישובית - נותנים לנו את ההרגשה שהמחשב מבין את השפה.

עם זאת, אם תריצו בגוגל טרנסלייט את המשפטים הבאים בספר, תגלו תמונה אחרת לגמרי וגם הדקדוק לא יהיה ברור. הפעם תקבלו טקסט שאיכשהו ניתן להבנה, לפחות אם אנו מכירים את המקור, אבל יהיה בלתי אפשרי לקריאה. הסיבה להבדל בין המשפט הראשון המוצלח להמשך שממש לא - היא העובדה שבין היתר המערכת של גוגל מאפשרת למשתמשים שמעוניינים בכך לשפר את התרגום היכן שנראה להם שצריך. כנראה שמישהו השקיע בתרגום השורה הראשונה בספר המופת של טולסטוי מרוסית לאנגלית - אבל ההמשך הוא דוגמה מייצגת יותר למה שהמערכת מסוגלת.

מאז שהמחשבים הפכו מציאות, האפשרות להשתמש בכוח הלוגיסטי שלהם על מנת להתגבר על מחסום השפה היתה הגביע הקדוש של למידה חישובית. הניסיונות הראשונים והלא מוצלחים התבססו על העיקרון שאת כל השפות ניתן לזקק לשני מרכיבים: לקסיקון של מילים עם משמעות ספציפית ומערכת חוקי דקדוק ותחביר, שבאמצעותם מחברים את המילים. כך לדוגמה, במלחמה הקרה הוגברו המאמצים של סוכנויות הביון האמריקאיות לפצח את "קוד" השפה הרוסית בקנה מידה תעשייתי - התוצאה היתה בעיקר ג‘יבריש.

פריצת הדרך המשמעותית הראשונה בפוטנציאל של תרגום מכני התרחשה בתחילת שנות ה-90 כאשר יבמ יצרה מודל שוויתר על המאמץ לגרום למחשב "להבין" את מה שמוזן לתוכו. במקום זאת הכניסה החברה למחשב כמה שיותר גרסאות של טקסט מתורגם, והמחשב היה צריך להחליט מהן משמעויות המילים והביטויים על סמך התקדימים הססטיסטיים. את הגישה הזו הוביל בענקית המחשוב פרדריק ג'לניק, שלא סמך על מודלים שמקורם באנלוגיות לצורת הלמידה האנושית של שפה. "כל פעם שפיטרתי בלשן", הוא סיפר, "תפקוד המערכת שלנו השתפר".

עשור מאוחר יותר התברר שהשיטה המבוססת על סטטיסטיקה מוגבלת למדי, ובנקודה זו החליטה גוגל להיכנס לתחום ברצינות. האגדה מספרת שהחברה החליטה לייצר מכונת תרגום בתום ישיבה אשר נערכה במטה החברה בקליפורניה ובה קיבל אחד המייסדים, סרגיי ברין, מכתב ממשתמש נלהב מדרום קוריאה. ברין הצליח להבין שהאחרון משבח את החברה, אך כשהריץ אותו בשירותי התרגום שגוגל קיבלה אז, התקבלה ה"ברכה": "הדג הלא מבושל הפרוס נעליים הוא מקווה. גוגל בצל ירוק משהו!".
גטי אימג'ס
מחפשים את המילה הנכונה גטי אימג'ס
עתיד רב-לשוני?

ברין האמין שלגוגל אמורה להיות היכולת והנחישות לספק משהו טוב יותר מהשטויות האלה. כיום, שירות גוגל טרנסלייט מציע תרגום מידי עבור 52 שפות, ומיליוני משתמשים נעזרים בו לתרגום דפים ברשת וטקסטים אחרים.

השיפורים של גוגל התבססו בעיקר על הנגישות הייחודית שלה לכמויות עצומות של טקסטים מתורגמים - מיליארדי משפטים וטריליוני מילים שאותם אפשר לסרוק בשניות בודדות ולאחר מכן לחפש את התרגום המתאים.

חלק ניכר מהנתונים מגיעים מפרוטוקולים של ישיבות באו"ם, שבדרך קבע מתורגמים על ידי בני אדם ל-6 שפות, ומפרוטוקולים של הפרלמנט האירופי המתורגמים ל-23 שפות. "הטכנולוגיה הזו יכולה לגרום למחסום השפה להיעלם", טען פרנץ אוז, שהוביל את צוות מכונת התרגום של גוגל. "היא תאפשר לכל אחד לתקשר עם מי שהוא רוצה".

בספרו האחרון Franca The Last Lingua טוען ניקולס אוסטלר, יושב ראש הקרן לשפות נכחדות, שמנועי תרגום - כמו זה של גוגל - ישחררו בסופו של דבר את העולם מהצורך ללמוד שפות דומיננטיות כמו אנגלית ויכפו מגוון לשוני. כאשר אני משוחח עם אוסטלר הוא משוכנע שהשינויים האלה הם בלתי נמנעים: "קל לחזות את העתיד,

אתה רק לא יודע מתי זה יקרה".

למרות שהוא שולט ב-26 שפות (ברמות שונות) מספר אוסטלר שלעתים קרובות הוא נעזר בגוגל טרנסלייט, ולטענתו מדובר במגמה שמייצגת את העתיד. "אם אתה לא מרוצה מהתרגום שאתה מקבל מגוגל טרנסלייט, אתה יכול מיד להבין את האפשרות שמציע ולהשוות זאת עם המידע שיש ברשותך. עדיין נדרשת אינטליגנציה קונסטרוקטיבית מצדו של המשתמש, אבל זה כבר הרבה יותר טוב ממה שהשירות הזה הציע קודם לכן ואין ספק שהוא רק ילך וישתפר".

עם זאת, טוען אוסטלר כי "יש כאן קצת אירוניה. האנגלית מתחילה לדעוך ומסתמן שהעתיד שלנו יהיה רב-לשוני, אולם יהיו פחות ופחות אנשים שדוברים כמה שפות". בספרו מציין אוסטלר כי השפות שצומחות בקצב המהיר ביותר ברשת (בסדר יורד) הן ערבית, סינית-מנדרינית, פורטוגזית, ספרדית וצרפתית. "הסיפור המרכזי של הצמיחה באינטרנט הוא המגוון הלשוני, לא ההתמקדות בשפות מסוימות".

לדבריו, ייצור המוני תמיד מספק מוצר באיכות ירודה יותר מתוצרת יד, וזה נכון גם לגבי גוגל טרנסלייט. ועדיין, אין בכלל ספק שככל שנכנסים למערכת יותר נתונים וככל שמטמיעים בה יותר שפות - היא תלך ותשתפר".

"אין הבנה של הטקסט"

אלה שעובדים בצדדים המדויקים יותר של מודלים לתרגום נוטים להיות זהירים יותר בחיזוי העתיד. פיל בלונסום, מרצה על למידה חישובית ובלשנות באוניברסיטת אוקספורד - שהיה מעורב ביצירת הדור הבא של כלים לתרגום - אומר שהבעיה היא ש"אפילו בצירופי המילים הפשוטים ביותר אנו צריכים לסרוק מרחב עצום של אפשרויות. על מנת שהמחשב יבין איך המשפט פועל, הוא צריך לחזור שוב ושוב על כל אפשרויות המבנה תחבירי בין שתי מילים שונות ואז להחליט מה הכי מתאים. זה מאוד מסובך, בעיקר כאשר המשפטים נעשים ארוכים ומורכבים יותר".

אנדריאס זולמן, שעבד בשנה האחרונה בגוגל טרנסלייט וחוקר את התחום שנים ארוכות, סבור בדומה לבלונסום שההנחה שהמערכת תשתפר ככל שיתווספו אליה נתונים - שגויה. "בכל פעם שהוכפלה כמות הנתונים של טקסטים מתורגמים שהוכנסו למערכת, חל שיפור של חצי אחוז בלבד באיכות התרגומים שהיא פלטה", הוא אומר.

לדבריו, ההכפלה הזו לא אינסופית. "כבר עתה אנו מתקרבים למצב שבו אין הרבה יותר נתונים בעולם שיכולים לשמש אותנו", הוא אומר. "לכן הרבה יותר חשוב כעת להיעזר בגישות שונות ובמודלים מבוססי חוקים".

יש גם כאלה שרואים תמונה הפוכה לחלוטין וטוענים שלא רק שהתרגום המכני לא יסיר את מחסום השפה, אלא שכלי התרגום האלה יגביהו את המחסומים. דאגלס הופסטדטר, שחיבר את הספר רב ההשפעה בתחום ההכרה והבינה המלאכותית: An Eternal Golden Braid Godel Escher Bach, וספרים נוספים על תיאוריות ויישומי תרגום, הוא אחד המבקרים החריפים ביותר של ה"הייפ" סביב גוגל טרנסלייט.  

לטענתו, היכולת להתקיים בתוך שפה ולנוע בין שפות; והאפשרות להבין את הדקויות, את הבדיחות, את משחקי המילים ואת צירופי המילים היחודיים - הן המאפיינים שהופכים אותנו להכי אנושיים ואינדיבידואלים. אחד הספרים שלו מבוסס על משימה שבמסגרתה תרגמו 80 אנשים את אותו השיר - ומסרו 80 גרסאות שונות (המפורסמות בספר).

המודלים הסטטיסטיים, לדבריו, מתחילים מהמקום הלא נכון. "אין שום ניסיון ליצור הבנה של הטקסט, ולכן החסרונות של גוגל טרנסלייט לא ייעלמו. ברור שמפעם לפעם המערכת יכולה לספק תוצאות טובות, אבל בעיקרון מדובר במערכת פזיזה. הם מספקים שירות ברמה נמוכה שלעולם יספק שטויות. אני מניח שכולנו ניכנע ללחצים ונשתמש במערכת הזו ברמה כזו או אחרת, אבל היא לעולם לא תוכל לספק לנו את הניחוח של הביטויים".

הופסטדטר טוען שכמו שאנו אוהבים את הרעיון שהעולם נעשה קטן יותר, כך אנו אוהבים לחשוב שהבנת שפה היא משהו מכני - עוד בעיה שאפשר לבקש מהמחשב שלנו לפתור. "הבנת העולם היא משהו שבני אדם טובים בו ומכונות ממש לא", הוא מסכם.

מאוד יכול להיות שבקרוב כולנו נהפוך לגוגל טרנסלייט - אולם ייתכן שנגלה שהמשמעות של הטקסט הולכת לאיבוד בתרגום.

כל המבזקים של nrgמעריב לסלולרי שלך

תגובות

טוען תגובות... נא להמתין לטעינת התגובות
מעדכן תגובות...

מדורים

  

פורומים

כותרות קודמות
כותרות נוספות
;
תפוז אנשים
vGemiusId=>/business_channel/tehnology/ -->