את התשובות לשאלות כמו זו שבכותרת אפשר להעריך, אבל עם קצת יצירתיות – אפשר גם לחשב, במידה גבוהה יחסית של דיוק. קבלו: תרגיל מהיר במחקר מילים מתקדם, והצצה לתוך האלגוריתמים הסמנטיים של גוגל.
פוסט למתקדמים.
מתנצל מראש שאין תמונות מסך – יהיו כשיהיה לי זמן להעלות.
מזה זמן שפוסט של בלוג החומוס מופיע בדף התוצאות הראשון עבור המילה "טמקא" (ynet באותיות עבריות). זו לא הייתה הכוונה, אבל מכיוון שזה קרה – מדובר בהזדמנות פז לברר את התשובה לשאלה שבכותרת.
בלוג החומוס שולט בתוצאות החיפוש בגוגל עבור המילה "חומוס". הוא מאייש את שתי התוצאות הראשונות, כאשר בראשונה יש לו סייטלינקס (Sitelinks) ובשנייה מיני-סייטלינקס (one-line sitelinks). במצב כזה אפשר להניח שהוא מקבל לפחות 60 אחוזים מהתנועה האורגנית עבור המילה (מעשית, זה יכול להיות גם 95%).
בלוג החומוס, למקרה שזה לא ידוע, שייך לי. לכן אני יכול לחשב בקלות ולהעריך שבשבוע ממוצע מחפשים את המילה חומוס 300-500 אנשים. בשביל המשך החישוב, בואו נאמר שהמספר הוא 400.
בעזרתו האדיבה של Google Webmaster Tools, אני יכול להשתמש בנתון שיש לי עבור המילה "חומוס", כדי להעריך את שכיחות החיפוש של ביטויים אחרים עבורם הבלוג מדורג באופן קבוע בדף הראשון (הסתכלו ב-Top Search Queries תחת Statistics).
בחישוב מהיר, עם נתונים של כמה שבועות, מצאתי שישנם כ-1300 חיפושים של המילה "טמקא" בגוגל בכל שבוע. לפי 52 שבועות בשנה, נמצא ש-67 אלף איש מחפשים "טמקא" כל שנה.
קצת קונטקסט
ראשית כמה הערות כדי להכניס את הנתונים לקונטקסט:
- לא דקדקתי מדי בשאלה האם מדובר ב-67 אלף חיפושים או מחפשים. אפשר לנסות לבנות מודל שיאפשר אומדן מדוייק יותר, אבל זה לא באמת חשוב לנו. מה שחשוב זו הדוגמא.
- אומדנים של חיפוש הופכים מדוייקים יותר ככל שהנתונים גדולים ורבים יותר. השונות בחיפוש של ביטויים שונים על ציר הזמן לא אחידה, וצריך להניח השפעות עונתיות (לדוגמא: "חומוס" מחפשים מעט מאד במהלך הפסח והרבה מאד מייד אחריו).
- "טמקא" הוא ביטוי עם ערך נמוך. רוב האנשים שמחפשים "טמקא", לא ייכנסו לתוצאה שאיננה ynet רק משום שעלתה בדף הראשון. לקדם מילים כאלו זה בדרך-כלל בזבוז זמן.
גוגל מדבר בשפת הבלוגים
וממצא שאיננו קשור אבל מרתק כשלעצמו: אחד מהדפים שעולים בתוצאות החיפוש למילה "טמקא" הוא הפוסט שוב אונס, שוב קלישאות מבלוג הסאטירה המוביל היתוך קר למפגרים. אם תחפשו, תראו שהמילה כלל לא מופיעה בדף הזה. המילה שכן מופיעה היא ynet.
החיפוש "טמקא" מחזיר כ-4000 תוצאות; החיפוש "ynet" מחזיר 15 מיליון תוצאות שאינן מהדומיין ynet.co.il, לכן ברור שגוגל לא מציג כל תוצאה שכוללת את המילה ynet בתוצאות החיפוש עבור המילה טמקא. למעשה, רק 15 מבין 100 התוצאות הראשונות מופיעות שם בלי שיכללו את המילה טמקא.
אילו אתרים? תמצאו שם, מצד אחד, אתרים נוספים של קבוצת ידיעות אחרונות, כמו Ynet Shops ,Ymap ואחרים. ומצד שני, דפים מבלוגים: הפוסט בהיתוך, פוסט של יובל דרור, פוסט מהבלוג שלי ברשימות ועוד. הוסיפו לכך את העובדה שבדף הראשון עבור התוצאות ל"טמקא" נמצאים גם נמרוד אבישר, עידו קינן, וניב ליליאן,
מה אפשר ללמוד מזה? ראשית, ש"טמקא" היא מילה שמשתמשים בה הרבה בבלוגים – אבל את זה אנחנו כבר יודעים. שנית, שגוגל יודע לא רק ש"טמקא" זה "ynet", אלא שאם אתם משתמשים בשני הכינויים במקרים שונים גוגל יידע להתעלם מהשניות ולבחור דפים לפי החשיבות והרלוונטיות שלהם לחיפוש, לא בהתאם לכינוי הספציפי בו אתם עושים שימוש. על מידת ההצלחה אפשר להתווכח, אבל קשה שלא להעריך את הניסיון.
אבל יש כאן משהו נוסף: הרבה בלוגרים משתמשים בכינוי "טמקא", אבל הכינוי הזה משמש תכופות גם בפורומים שמתארחים באתרים גדולים וחזקים. נראה שגוגל מעניק עדיפות ברורה לבלוגים בתוצאות החיפוש למילה הזו, ולא רק כשיש להם דף מיוחד (דף תגית) עבור המילה "טמקא" (כמו אצל נמרוד או ניב) אלא גם כשהם משתמשים בה באגביות, מדי פעם, כחלק מהשפה שלהם (עידו, ההיתוך, יובל).
שימו לב שהתוצאות עבור המילה "טמקא" זרועות גם בדפי Web 2.0 למיניהם: הטוויטר של תומר כהן, דף תגית בפליקר אחד, דף מהאתר שווה קריאה, פידים, ועוד.
אני משאיר לכם להסיק את המסקנות בעצמכם. מה שאני כן יכול לומר, וזו אמירה מאד אינטואיטיבית, הוא שלדעתי האלגוריתם של גוגל הגיע לשלב שבו הוא מזהה לא רק מילים נרדפות ועננים סמנטיים אלא גם משלבי לשון.
בפוסטים עתידיים ארחיב קצת בעניין הזה, אבל בינתיים אפשר לסכם: גוגל מדבר בשפת הבלוגים.
[ הערת אגב 1: נניח שארגון גדול שוכר חברה מאגניבה כדי שתתפעל עבורו "בלוג" ותזין אליו תכנים על בסיס קבוע. כמה זמן ייקח לגוגל עד שיבין שהשפה בה הבלוג נכתב היא לא באמת מגניבה? ]
[הערת אגב 2: כמה קשה זה יהיה, לדעתכם, לשכנע את גוגל ש"שוקי גלילי" הוא בעצם שם נרדף ל"Brad Pitt"? ]
אהלן,
לא ברור לי איך הגעת למספרים שהצגת.
ראשית, לפי הגוגל Keyword Tool, את הביטוי "חומוס" מחפשים 22,200 איש בחודש.
שנית, מנסיוני, מספר הכניסות לתוצאות החיפוש הראשונות בגוגל קטן בהרבה מ-60%.
ובכלל, למה אתה נזקק להערכות כשאתה יכול לקבל את הנתונים האמיתיים (אם אתה מאמין לגוגל) מהKeyword Tool והאנליטיקס.
מה פספסתי?
והעיקר שכחתי:
לפי הכלי של גוגל, את הביטוי "טמקא" מחפשים 9,900 איש בחודש, כלומר כ-120,000 איש בשנה
את האומדן הכולל של החיפושים חילצתי באמצעות חלוקה של נתוני אנליטיקס ב-CTR משוער של 60%.
אם תקרא שוב, תראה שאמרתי שאני מעריך ששתי התוצאות הראשונות עבור המילה חומוס, נותנות לי יחד (לפחות) 60 אחוז מהקליקים (וכאמור – התוצאה הראשונה מציגה סייטלינקס, שעשויים להגדיל דרמטית את ה-CTR). זה שמרני מאד, אפילו בהשוואה לנתונים של קורנל
http://www.seoresearcher.com/distribution-of-clicks-on-googles-serps-and-eye-tracking-analysis.htm
לגבי כלי מילות המפתח של אדוורדס – הוא לא נותן מספרים מדוייקים. המספרים הם "בדידים" לא "רציפים", כלומר מייצגים טווח שבתוכו נמצא הנתון האמיתי על שכיחות החיפוש.
לדוגמא: הנתון של 22,000 יכול לייצג מספר כלשהו שנמצא בטווח שבין 15 ל-30 אלף (גם המספרים רק בשביל הדוגמא, ישירות ממוחי הקודח). כך שאם גוגל מדווח על שכיחות חיפוש דומה לשתי מילים, ייתכן שאחת מהן שכיחה בחיפושים פי שניים מרעותה.
גוגל לא חושפים מהם התחומים ולכן אי אפשר לבצע חישובים על הנתונים – חוסר הדיוק יכול להגיע למאות אחוזים. לעומת זאת, אני הצגתי דרך פשוטה שבה כן אפשר לבצע חיפוש ולקבל אומדן די מדויק, כנראה.
זה לאו דווקא "טמקא" ו"ynet". למעשה זה "google.com" ו-"google.co.il".
נסה לחפש "aueh dkhkh", למשל (ואם מופעל לך ה-suggestion) מספיק שתגיע עד "aueh" כדי לראות שגוגל "הבין" את המשמעות. כבר ב"aueh dk" הוא הציע לי תוצאה אחת בלבד.
מזה אתה יכול להסיק שיהיה נורא קשה לשכנע את גוגל ש"שוקי גלילי" הוא בעצם שם נרדף ל"Brad Pitt". (ואם תנסה לכתוב "crts" התוצאה הראשונה שגוגל מציע היא "בראד פיט").
כל העניין עובד כל עוד אתה אכן עם google.co.il (אם תנסה להקיש "טמקא" ב-google.co.il ההצעה הראשונה היא "ynet". אם תנסה ב-google.com ההצעה של גוגל היא "טמקא").
google.co.il יודע לתקן שגיאות של עברית/אנגלית כי הוא co.il ולכן אם הוא לא מוצא משהו מתאים הוא אוטומטית מנסה לשייך את האיות מעברית לאנגלית (ולא מצרפתית, גרמנית או שוודית).
בוא נעזוב רגע את מקרה שוקי גלילי ובראד פיט ונחפש דוגמא דומה יותר (מבחינות רבות).
אני טוען ש"טמקא" קיבל בגוגל מעמד טוב יותר משל טעות הקלדה. גוגל מזהה שזו מילה נרדפת ל"ynet".
גם כשאתה מחפש "'שךךש" גוגל שואל אותך האם התכוונת ל"walla", אבל תסתכל על מבנה התוצאות ותשווה לתוצאות עבור טמקא
http://www.google.co.il/search?hl=iw&rlz=1T4GGLJ_enIL211IL211&q=%27%D7%A9%D7%9A%D7%9A%D7%A9&meta=
אינטואיטיבית אנחנו יכולים להבין שמדובר בחיפוש שונים: הביטוי 'שךךש לא הפך כינוי של וואלה כשם שטמקא הפך כינוי ל-ynet.
דוגמא נוספת: אם תחפש "נרג" התוצאה הראשונה תהיה, כמובן, NRG. אמנם בעקבות סיפור ה"miserable failure" גוגל הרבה יותר זהירה בלכלול בתוצאות עבור ביטוי מסויים דף שאינו כולל את הביטוי. ובכל זאת, אתה תמצא את NRG במקום הראשון משום שגוגל "יודע" שנרג היא מילה נרדפת ל-NRG כמו ש"האווירון" הוא כינוי לאלון מזרחי.
אולי מישהו ירצה לקדם את עצמו במילת "אשפוז"?
מה זה פה, אני קורא פוסט אקראי ופתאום מוצא את השם שלי משולב בתוכו? 🙂
צא וחשוב: כמה פעמים היית נתקל בשם שלך לו היית מקפיד לקרוא בצורה מסודרת את מה שאני כותב.
פעם אחת?
מוזר לי שגוגל לא אינדקס את הדף הזה כמו שצריך, אחרת הייתי מקבל הודעה על כך אצלי.
נו, תומר, אתה מפתיע אותי – אתה לא באמת חושב ש-Alerts מזדהה דפים כשהם עולים לרשת ומתריע עליהם, נכון? אגב, לפעמים אני מקבל התראות על אייטמים שלי ב-ynet חודשים אחרי שעלו. גוגל עושים עכשיו מהלך שקט של להתבסס יותר על רסס, כולל אפשרות להשתמש ברסס כסייטמפ.
אגב, בדיקה קצרה העלתה שגם הדף בפליקר הוא שלי בסופו של דבר (וכנראה גם הדף בשווה קריאה). אני חייב להפסיק לתייג דברים. 🙂
פינגבאק: אסכולת הכורסא » שפת הבלוגרים, שפת הקוראים