 | |  | הקול עולה גבוה |  |
|  |  | טכנולוגיית זיהוי הקול עברה אבולוציה של ממש מאז שנאלצנו, עד לא מזמן, לשאוג על הסלולרי |  |
|  |  | |  |  | הביטוי האמריקני השגור "טוק טו דה הנד" (דבר אל היד) מעולם לא היה קונקרטי יותר, והוא מקבל כיום משמעות חדשה בעזרת טכנולוגיית זיהוי קול חדשה Speech Recognition().עד כה, הכרנו את היכולות הלוקות בחסר של הזיהוי הקולי מן הטלפונים הסלולריים, שאותם היה עלינו "לאמן" בטרם שימוש. לפני שהספקנו להתרגל אל הטכנולוגיה הזו, הביאה עימה שנת 2003 דור חדש ומשודרג של זיהוי קולי, אשר מבלי לעבור סדרת אימונים יזהה את הבקשה, יבחין בין אותיות למספרים, יידע לשלוף מתוך רשימת טלפונים את השם המבוקש, ובעתיד הלא כל כך רחוק, כך מתברר, נוכל לדבר עם המחשב, והוא יידע לחבר מלים למשפטים, להבין את תוכנם ואף לנהל עימנו שיחה.בעקבות השדרוג שעברה הטכנולוגיה, מבצבץ ועולה מגוון מכשירים אשר פועלים עלידי מערכות הפעלה המבוססות על שבב הזיהוי הקולי. טכנולוגיה זו אינה פוסחת אפילו על נגני MP3 וטלפונים סלולריים, וגם לא על שרתים לשימוש מערכות טלפוניה."בעתיד, בעזרת טכנולוגיה לזיהוי קולי, יהיה לאנושות הרבה יותר פשוט וקל להתמודד עם מענה קולי ומוצרי אלקטרוניקה. הנושא יהיה כל כך קל, שאפילו להדיוטות, שלא מבינים כל ום במחשבים, יתאפשר להסתדר איתה, כי היא מאוד פשוטה. צריך רק לדבר". כך טוען צביקה וולף, מנהל תחום CRM בחברת AVAYA ישראל. |  |  |  |  |
|  |  |  |  | מגוון רחב של גאדג'טים
|  |  |  |  | ואכן, כבר בימים אלו ניתן למצוא בשוק בעולם מגוון רחב של גאדג'טים חדשים, המשתמשים בטכנולוגיית זיהוי הקול. דוגמה לכך מביאה חברת e.Digital האמריקנית, אשר תשווק השנה בארה"ב את נגן MP3ה הנקרא 1000 Odyssey מתוצרתה, אשר ניחן בתוכנות חדשות, הפועלות תחת מערכת ההפעלה 2 MicroOS של החברה, ומשלב בתוכו תוכנת זיהוי קולי של חברת Lucent Technologies, הנקראת VoiceNav.שבב התוכנה מפעיל מנוע לזיהוי קול, המכיר מעל 100 אלף מלים ושמות המתאימים למכשיר. ב20 הג'יגהבייט דיסק קשיח שעליו בנוי Odysseyה, ניתן לאגור יותר מ500 דיסקים, כך שבעזרת VoiceNavה איתור שיר מסוים אינו מסורבל ומאיים.בנוסף, מכשיר זה יכול לשמש גם כטייפ מנהלים, בזכות יכולת ההקלטה שלו. את הקבצים המוקלטים ניתן להכניס לספריות מיוחדות, כשבעזרת פקודות קוליות וללא הכשרה קולית מוקדמת, ניתן לנווט ולהיכנס אליהן מבלי להיעזר במקשי הניתוב על המכשיר. פרט לזיהוי קולי, Odysseyה ניתן לשדרוג עתידי של קבצים מפורמטים חדשים. כיום המכשיר תומך בקודק המאפשר השמעה של קובצי MP3 WMAו בלבד, אך אם ייצא קודק חדש, ניתן יהיה לשדרג את התוכנה ול התאים אותה לפורמטים אחרים. למכשיר יש מסך LCD ברזולוציה של 64x128 פיקסלים, חיבור 8 ,USB מגהבייט זיכרון מובנה מסוג DRAM לבלימת זעזועים, וסוללת ליתיוםיון המספיקה ליותר מ12 שעות נגינה. מחירו נע בין 100 ל200 דולר.התפתחות שבבי הזיהוי הקולי מוכיחה את עצמה, ועל כן היא משתלבת ותורמת להתפתחותם של מכשירים אלקטרוניים, גאדג'טים ומערכות טלפוניה בשרתים. למרות ההתפתחות האחרונה שחלה בטכנולוגיה, אנחנו רואים רק את האור בקצה המנהרה.גדעון זוסמן, מנהל קרן הון סיכון של חברת פיליפס בישראל, המשקיעה לאחרונה את מלוא המרץ בשרתים בעלי זיהוי צלילי, ואחד מחסידיה של הטכנולוגיה, מסביר: "משום שאלגוריתם זיהוי הקול מאוד מסובך, הוא עומד כיום רק על כ85 אחוז הצלחה בזיהוי, ולמרות זאת, הוא אמצעי הקלט הטוב, הקל והנוח ביותר לשימוש". |  |  |  |  |
|  |  |  |  | לומדים משפטים
|  |  |  |  | זוסמן מגלה, כי ממש בימים אלו עובדות מספר חברות על פיתוחו של Free Speechה, טכנולוגיה אשר בעזרתה מחשבי העתיד יוכלו לחבר מלים למשפטים, לזהותן וגם להבינן. אחת מהחברות הרואות את החזון הזה כממשי יותר מתמיד, היא חברת Sensory האמריקנית, אשר נוסדה בשנת 1994 ומתמחה בנושא הזיהוי הקולי.על פי חזונה של החברה, לכל אדם תהיה האפשרות להפעיל כמעט כל מוצר עלידי דיבור אליו, החל ממכשירי חשמל ביתיים וכלה במכוניות או מחשבים, והמכשירים, מצדם, יבינו ויענו בחזרה. עד אז, מספקת Sensory קושחות (שבב המכיל תוכנה) קטנות בעלות יכולת זיהוי קולי, המתאימות לפעולה בשילוב עם טלפונים סלולריים, מחשבי כף יד, טלפונים אלחוטיים, מכוניות (הפעלת הרדיו/דיסק או מערכת ניווט), מוצרי רפואה וצעצועים. מכשירים אשר הושתל בהם השבב, יהיו מסוגלים לסנן רעשי רקע ולהתמקד בפקודת הדיבור, לזהות צלילים, לתמוך בדיבור מרמקול, דיבור בלחישה ולזהות מלים בתוך משפט.גודלם הקטן של השבבים פתח בפני החברה האנושית בעולם מגוון רחב של מכשירים מגדלים שונים, היכולים לשלב בתוכם את טכנולוגיית זיהוי הקול. דוגמה טובה למכשירים קטנים שכבר החל ו לשלב בתוכם את הטכנולוגיה, הם שעוני היד והטלפונים הסלולריים.אחד משעוני היד אשר נהנה ממזעור הטכנולוגיה, מקושחה בעלת זיהוי קולי, הוא XAct WristLinx communicator. חברת Xact Communication האמריקנית, עיצבה שעוןיד בעל מסך ומעט כפתורים, הוסיפה לו יכולות תקשורת כשל מכשיר קשר, אך הורידה את כפתור העברת הערוצים. הפתרון מגיע, כמובן, דרך זיהוי קולי, ודרכו ניתן להחליף בין 22 הערוצים המצויים בשעון. פרט לכך, WristLinxל מסך LCD ומטען לסוללת ליתיוםיון, והוא קולט למרחק של כ2.5 קילומטרים. מחירו כ50 דולר.הסלולריים, שבינתיים הספיקו להתכווץ, ולהגיע לגדלים של שעוני יד, הודות לזיהוי הקולי, אינם חייבים במקלדת טלפון. דוגמה לטלפון סלולרי כזה מביאה חברת סמסונג. הטלפון מדגם sphs100, קטן מידות במיוחד, ואין אפשרות לצייד אותו במקלדת. על כן, ההתקשרות, שמירת הטלפונים ושליחת SMS מבוצעים בעזרת טכנולוגיית הפעלה קולית, ועלידי תוכנת קוללטקסט Talk To Speech() אשר כותבת את המלים הנאמרות על המסך. הטלפון עדיין אינו משווק, אך מחירו נאמד ב100 דולר. |  |  |  |  |
|  |  |  |  | סופרים עד עשר
|  |  |  |  | הסיכוי לראות את שעוני היד בפעולה בזמן הקרוב בארץ, נמוך מאוד. לעומתם, טלפון סלולרי הנקרא ספיריט SPIRIT(), הוא מוצר כחול לבן, המיוצר ומפותח בארץ עלידי חברת מוטורולה ישראל, והוא אמור לצאת לשווקים בקרוב ברשת פלאפון. הטלפון מותאם במיוחד לנהיגה ברכב, והוא הראשון אשר ישתמש בטכנולוגיית זיהוי קול בעברית ללא צורך באימון מוקדם של מספרים. בעת הנהיגה, ניתן יהיה ללחוץ על ראש הטלפון מבלי להוריד את העיניים מהכביש, ולחייג קולית עלידי אמירת הספרות, אשר יוצגו על צג הטלפון.הספיריט יפעל בטכנולוגיית CDMA X1, ואף נועד להתחבר בחיבור USB או Bluetooth למחשב נישא, או למחשבי כף יד כדוגמת פאלם או iPAQ. מחירו עדיין לא נקבע.דוגמה לכך שניתן לדחוף את הטכנולוגיה לכל מוצר אפשרי, מגיעה בדמות אייבו של סוני. אייבו הוא הכלבלב הרובוטי המשמש כחיית מחמד והמסוגל לבצע פעולות בכוחות עצמו. לאחרונה (בדגם 2003), הוא החל להבין גם פקודות קוליות באנגלית.תוכנת הזיהוי הקולי החדשה של אייבו, מתוכנתת להבין 70 פקודות אשר משמשות לציווי על הכלבלב ולשיחה עימו. הכלבלב יציית לפקודות הקוליות כשיתבקש (עמוד, שב, בוא נשיר, צלם או שתוק), וכן יענה בשפתו, בתנועות ובהבהוב אורות לשאלות שיוצגו בפניו (איך אתה מרגיש? איך קוראים לך? אתה עייף? אתה שמח? אתה עצוב?).תוכנת זיהוי הקול תורמת במידה ניכרת להרגשת החיות של אייבו. בזכותה הוא יודע לזהות ניואנסים ולהבדיל בין מלים שנשמעות דומה. אך מאידך, אי אפשר להתעלם מן העזרים והחלקים (כרטיס זיכרון, סוללה נטענת, מעבד וכפתור כיבוי והדלקה) ומן הקול הדיגיטלי הבוקע מגרונו, ששוב מוכיחים כי האייבו הוא בסך הכל רובוט בתחילת המאה ה21. מחירו בארץ כ15 אלף שקל. |  |  |  |  |
|  |  |  |  | גם במחשב האישי
|  |  |  |  | גם את המחשב האישי ניתן לקשט ולייעל בעזרת התקנת מגוון מוצרים בעלי תכונות זיהוי קולי. למשל, לאוזניות (סטייל מדונה) USB Speech Recognition Headset & Software של חברת Plantronics, יש חיבור USB למחשב ומעבד קול דיגיטלי DSP 32 bit. בעזרת תוכנה לזיהוי קולי המצורפת עם האוזניות, הנקראת 4.01 H&L VoiceXpress Professional, ומעבד הקול הדיגיטלי, ניתן לדבר ישירות אל המחשב לכתיבת מסמכים או אימיילים, כאשר בדיבור בלבד יזהה המחשב את המלים ויקליד אותן במעבד התמלילים או במייל. מחיר האוזניות מדגם DSP100 קרוב ל100 דולר.בניגוד לתוכנת האוזניות, אשר זקוקה לאוזניות עצמן, פיתחה חברת הסטארטאפ הישראלית Commodio עכבר חדש למחשב ללא עכבר, המנתח את תוכן המסך תוך שימוש בבינה מלאכותית, הנקרא QPointer Handsfree. תוכנת העכבר משולבת בטכנולוגיית מנוע זיהוי קול של מיקרוסופט, ופקודה קולית של המשתמש תקפיץ את סמן העכבר אל מלים או כפתורים בסרגל הכלים, שעליהם הוא רוצה להצביע, ותקליק עליהם.סרטים שנחשבו למדע בדיוני לפני כ10 שנים נראים היום מציאותיים למדי. אם ניקח לדוגמה סצינה מתוך מסע בין כוכבים, הקפ טן ז'אן לוק פיקארד משוטט על כוכב חדש שרגל אדם לא הספיקה לדרוך בו, ובשיחת טלפון אחת עם המחשב על ספינת החלל מברר פרטים על הכוכב, או מקושר עם הסגן. |  |  |  |  |
|  |  |  |  | כמו במסע בין כוכבים
|  |  |  |  | כיום, בדומה לסצינה ממסע בין כוכבים, קיימות מערכות מחשבים וטלפוניה אשר בעזרתן ניתן לדבר עם המחשב דרך הטלפון הסלולרי מכל מקום בעולם, ובעזרת זיהוי קולי אפשר לשלוח אימיילים ופקסים.צביקה וולף מפרט: "דרך הטלפון ובחיבור לשרת, ניתן לשלוח אימיילים. המחשב יודע להקריא דואר אלקטרוני, לכתוב אותו כאשר מכתיבים לו ולשלוח בעזרת פקודת 'שלח'. בארה"ב, למשל, אנשים שמסתובבים ברחוב כבר לא צריכים פאלם או מחשב נייד. מספיק שיהיה ברשותם טלפון סלולרי בשביל לקחת איתם את האימייל או הפקס. אם עד עכשיו היינו צריכים לגלוש באינטרנט בכדי להוריד אימיילים, היום אפילו בנסיעה ברכבת אפשר לחייג אל המענה הקולי, ולדבר איתו".במקביל לוולף, מספר זוסמן על זיהוי צלילים בעזרת הטלפון: "לפיליפס יש כיום שרת בעל מידע עצום לשירים. דרך הטלפון הסלולרי, מספיק להקליט 3 שניות מתוך שיר בכדי שזה יזהה אותו, וישלח אל המבקש את כל הפרטים על השיר, מי הזמר, מספר דקות ואפילו היכן ניתן לרכוש".האם השפה עברית תיכנס למערכות מסוג זה?וולף: "היום המערכת תומכת ב27 שפות, וביניהן גם עברית. למרות זאת, ישראל עדיין אינה על המ פה, אבל אנחנו צועדים בצעדי ענק לקראת האמריקנים. אם בארה"ב אפשר כבר להזמין פיצה בשיחה עם המחשב זה כמה שנים, אצלנו זה יכול לתפוס בדיוק באותה מידה".אם ישנה טעות? אני מבקש פיצה עם פיטריות והמחשב שמע בצל?"המחשב לא טועה אף פעם. גם אם קרה והמחשב שמע משהו אחר, הוא שואל את הלקוח האם זו הבקשה הנכונה לפני כל פעולה שהוא מבצע. משום כך הסיכויים לטעות הם אפסיים. פרט לכך, הטכנולוגיה השתדרגה פלאים ועברה אבולוציה בתפיסת השפה, מלים נרדפות ואפילו מבטאים שונים". |  |  |  |  |
|
|  | |