ראשי > הרשת > איך זה עובד?
בארכיון האתר
איך עובד מנוע חיפוש?
ארז בן-ארי מאבד עוד תעלומה טכנולוגית
לכתבה הקודמת דפדף בהרשת לכתבה הבאה
ארז בן-ארי, עסקים און ליין
3/11/2004 9:30
כמות המידע האינסופית הזמינה באינטרנט הולידה מקצוע, שמומחיותו של העוסק בו היא לדלות מידע מהרשת, והוא מכונה "מידען". ללא מנועי החיפוש, לא הם ולא אנחנו היינו יכולים למצוא מחט בערימת השחת הנקראת אינטרנט.


מנועי החיפוש מתחלקים לשני סוגים: "ספיידר" ו"אינדקס". אינדקסים הם אתרים פשוטים למדי: מנהל האתר מקבל דיווחים מבעלי אתרים ומאזרחים מודאגים על קיומם של אתרים חדשים, ומוסיף אותם למאגר הנתונים שלו. כדי לסייע למחפשים, נהוג גם להוסיף תיאור מילולי של האתר ומילות מפתח הקשורות לתוכן. למשל, אתר העוסק בתמיכה טכנית יוסיף את המילים "עזרה", "תקלות", " בעיה" וכד'.


מנועי חיפוש מסוג ספיידר הם מחשבים רבי-עוצמה, המחוברים לאינטרנט בחיבור מהיר מאוד. גם מנועי ספיידר מקבלים דיווחים על אתרים חדשים, אבל במקום
מפעיל אנושי הם משתמשים בתוכנת סריקה אוטומטית. התוכנה נכנסת לאתר, "קוראת" את כל תוכנו וגם את זה של הקישורים שהוא מכיל. ספיידר כזה מסוגל לסרוק כ-25 דפים בשנייה, כלומר 2 מיליון דפים ביום. כדי לחסוך מקום, התוכן נדחס באמצעות אלגוריתמים המזכירים את דרך פעולתן של תוכנות הכיווץ, אבל עדיין מנועי חיפוש זקוקים לדיסקים קשיחים עצומים כדי לאחסן את כל המידע הזה.


מנועי החיפוש משתמשים גם במסננים מיוחדים, המאפשרים להם לסרוק תוכן מסוגים שונים. מנועים רבים מסוגלים, למשל, לסרוק קובצי PDF, או קבצים של מעבדי תמלילים שונים, ולקטלג גם את תוכנם. כדי לייעל את תוצאות החיפוש, משתמשים המנועים במסננים לשוניים, המאפשרים להם להתעלם ממילות חיבור נפוצות באנגלית, כמו What ,A ו-The. קיימים גם מסננים לשפות זרות.

איך מדרגים את תוצאות החיפוש
מנועי חיפוש שונים משתמשים בנוסחאות מתמטיות שונות לדירוג התוצאות שהם מציגים. המטרה היא לנסות לספק למחפש תוצאה קרובה ככל האפשר לזו שביקש למצוא. מנועים אחדים מדרגים את האתרים על-פי מספר הפעמים שמילה מסוימת מופיעה בהם. בדפי אינטרנט קיימת אפשרות להוסיף מילות מפתח שונות על-ידי שילוב הערות מסוג Meta-Tags בגוף האתר. הערות אלה בלתי נראות למשתמש, אבל המנועים רואים אותן וחלקם נעזרים בהן כדי לדרג את האתר בצורה מדויקת יותר. למרבה הצער, בעלי אתרים חסרי מצפון החלו לנצל את הטכנולוגיה כדי להטעות מנועי חיפוש, ולכן מנועים רבים מתעלמים היום מהתגיות הללו.  

מנוע החיפוש גוגל משתמש בשיטה ייחודית כדי לדרג את התוצאות. הוא בודק אילו אתרים מכילים קישור אל אתר ספציפי, ועל-פי המספר נותן לאתר דירוג. אם האתר זוכה לקישורים רבים, יהיה לו דירוג גבוה יותר והוא יופיע בתוצאות לפני אתרים אחרים בעלי תוכן דומה. 
  
רוצים לדעת עוד? ארז בן-ארי עונה על כ-ל שאלה שקשורה למחשבים בפורום "המחשב השתגע?!" ב-NRG
חדשות
חיי רשת
טיפים
גאדג'ט
גיימינג
סלולר
  מדד הגולשים
ויאקום תובעת...
                  15.49%
פלאפון מצטרפת...
                  9.86%
לעקוף את חוק...
                  8.45%
עוד...

איך זה עובד?
איך עובד אינטרנט במטוס?  
איך עובד PayPal?  
מחשב שחמט  
עוד...