גוגל מנסה לאזן בין מסנני הספאם שלה לבין הצורך "לבוא לקראת הגולש" כשהיא מנסה להבין את כוונת שאילתת החיפוש שלו. התוצאה: מקדמי אתרים דוגמת ראנד פישקין, עושים ניסויים מעניינים.
דן מאתר המקצוענים הסב את תשומת לבי לדומיין Randz.net, שמופיע במקום החמישי כשמחפשים בגוגל "Rand Fishkin". בהחלט מקרה מבחן מעניין ששווה להתעכב עליו.
מדובר בכתובת ששייכת לראנד פישקין (מקדם אתרים רב-פעלים) מ-SEOMoz, ולפי דף הפרופיל שלו היא שימשה בעבר את הבלוג האישי שלו. כיום יש בה דף אחד שהתוכן היחיד בו הוא צמד המילים "It Works!" שמופיע בכותרת ובגוף.
מה ניסה ראנד לעשות כאן? ובכן, דרך אחת לנסות לגלות היא לחפש את הפוסט שבו וודאי כתב על הניסוי – ויש כאן ניסוי – ולראות מה הוא אומר. ומצד שני, ייתכן שהוא עוד לא כתב את הפוסט…
בכל אופן, לי זה הזכיר מייד את "תופעת טמקא" עליה כתבתי כאן מוקדם יותר השנה. אתם מוזמנים לקרוא את הפוסט ההוא, אבל הדוגמא שלפנינו די מסבירה את העניין;
נראה שפישקין רצה להוכיח ש-Google מזהה חד-חד-ערכית את הביטוי "randz" (שמופיע אך ורק בשם הדומיין ואפילו לא בטקסט של האתר), עם השם שלו – ומציג את האתר הישן בתוצאות.
עקרונית, בהתחשב בעובדה שבעבר היה בכתובת הזו אתר פעיל ואנשים קישרו אליו, סביר להניח שהשם המלא של פישקין הופיע בהרבה Anchors. מצד שני, לפי מה שגוגל טוענת מרגע שפישקין הסיר את התוכן הישן, האתר הזה לא באמת אמור היה להופיע בתוצאות – הוא הפסיק להיות רלוונטי.
בעקבות פרשת ה"Miserable Failure" (הפצצת הגוגל ההיסטורית נגד ג'ורג' בוש הבן ב-2005) גוגל הכניסה לשימוש על פי דבריה פילטר שאמור לסנן החוצה תוצאות לא רצויות מהסוג הזה בדיוק. התוצאה: אם מילה שמופיעה ב-Anchors של לינקים נכנסים לא קיימת באתר עצמו הוא יסונן – או לפחות זה מה שאמור לקרות.
מצד שני, גוגל גם נוהגת להתגאות ביכולת של מנוע החיפוש שלה "להבין את הגולש" ולהציג תוצאות שמתאימות "למה שהוא רוצה ולא למה שחיפש". כשהם מדברים על הטכנולוגיה הזו הם אומרים בפירוש: נדע להציג את התוצאה הרלוונטית גם כשהמילות המפתח בהן השתמש הגולש לא מופיעות כלל באתר.
האם זה סותר? לא. גוגל כנראה מסוגלת ל"הבין" משום שהאלגוריתם שלה מביא בחשבון קשרים שונים בין מילים – החל מזיהוי טעויות הקלדה נפוצות למילים פופולריות ועד השתייכות של מילים שונות לשדה סמנטי משותף (הכרחי כדי לזהות גבולות של Topical Community). הגדרת הקשרים מאפשרת ליצור הקשר ולדמות "הבנה".
יום אחד, אולי Google ידע שכאשר אנחנו מחפשים "הבלוגר והעיתונאי הדעתן שיש המכנים אותו יושב-ראש" בעצם אנחנו מתכוונים לד"ר יובל דרור, אבל לא מדובר אפילו על זה, אלא על דבר הרבה יותר פשוט: על זיהוי הקשר של מילים נרדפות.
Google יודע כבר היום – לפחות במידה מסויימת – לזהות מילים נרדפות וגם כינויים, "ניקים", שהם מילים נרדפות לכל דבר. לדוגמא: אם אנשים מחפשים את הביטוי "מקדם אתרים" לא אכפת להם לראות תוצאה שמשתמשת בביטוי "מומחה לקידום אתרים". אם הם מחפשים את ראנד פישקין, שמכונה לפעמים "Randz", זה הגיוני שירצו לראות גם את התוצאה שכוללת רק את הכינוי הזה ולא את השם המלא.
מלבד המופע בשם הדומיין, מוביל לאתר הישן בין השאר, לינק מהדף של פישקין ב-SEOMoz. השם המלא מופיע בכותרת ולא ב-Anchor, מה שאומר שגוגל אולי דירג אותו על סמך הרלוונטיות של הדף המקשר – לא של ה-Anchor – וייתכן אפילו שזה המקור הסמכותי (בכל זאת, זהו האתר של ראנד פישקין) שיצר את הזיכוי "randz" ל"Rand Fishkin".
כדי להכניס את כל העניין לפרופורציות: ראיתי כבר הרבה מקרים שבהם גוגל המשיך להציג תוצאה למרות שהתוכן המקורי השתנה משמעותית או הוסר לגמרי – ובלי שהיה שם ראנד פישקין לעשות ניסויים. הפילטרים של גוגל, מה לעשות, עדיין רחוקים משלמות. עוד סיבה שחלק גדול מהניסויים האלה הם בזבוז זמן כי אתה עומד על "אדמה לא יציבה" – חלקים של האלגוריתם שעדיין צפויים לשינויים מפליגים, ואיש לא יודע מה ילד יום.
האם יש דברים פרקטיים שאפשר לעשות עם התובנות האלה? תשפטו לבד: חפשו בגוגל "בעלי מקצוע", וגללו לתחתית הדף. תבדקו מה אתם מוצאים תחת "חיפושים קשורים ל:". הקליקו על הלינק הימני ביותר ותראו מה אתם מוצאים. הכל White-Hat למקרה שתהיתם.