"תוכן כפול" הוא לא רק תוכן שפורסם מחדש באתרים אחרים, אלא גם שם כולל למגוון מצבי Onsite שבהם תוכן שוכפל במכוון או נראה כמשוכפל בגלל בעיות טכניות שונות, הגדרות שגויות וכו'. הרבה לפני אלגוריתם פנדה, ההתמודדות עם בעיות תוכן כפול לסוגיהן הייתה קריטית להצלחת הקידום. "תקציב הזחילה" הוא אחת מהסיבות לכך.
פורסם: 10 למרץ 2010.
עודכן: 7 למאי 2012.
אירוני: פרסמתי את הפוסט הזה במקור לפני למעלה משנתיים, ועקב פרסומים חוזרים שלו באתרים אחרים הוא עצמו הפך לתוכן כפול (אחרי שדורג #2 עבור הביטוי "תוכן כפול"). מכיוון שגם אני, כמו כל הסנדלרים, הולך יחף, לא מצאתי עד עכשיו את הזמן לתקן את המעוות.
כדי להבין את הטכניקה שבה מצבעים "החייאה" במצב כזה, מומלץ לקרוא גם את המאמר "מתי תוכן כפול הוא לגיטימי ואיך מסבירים את זה ל-Google", שפרסמתי לא מזמן בבלוג ה-SEO של פבל ישראלסקי. שימו לב שנושא הפוסט הזה הוא כפילויות תוכן בתוך אתר – לא בין אתרים.
לסקירה מסודרת של הסוגים השונים של כפילות תוכן ודרכי הטיפול המומלצות, כדאי מאד לקרוא את המאמר "Duplicate Content in the Post-Panda World" בבלוג של SEO Moz או את הגירסה העברית שלו "כפילות תוכן לאחר עדכון פנדה", בבלוג של דוראן.
ואם אתם עושים את צעדיכם הראשונים בעולם ה-SEO וכבר הצלחתי להבהיל אתכם, מומלץ להתחיל בכלל במקום אחר: בפרק על תוכן כפול בסדרה "קידום אתרים ב-10 ימים" שכתבתי עבור ynet ב-2009 (הרבה השתנה אבל היסודות זהים).
כמה הגדרות: מה זה תוכן כפול?
בואו נתחיל בהגדרה: תוכן כפול (Duplicate Content) הוא תוכן שיש לו מספר מופעים במיקומים שונים ברשת, באותו אתר או באתרים שונים.
בפוסט הזה מעניין אותנו בעיקר תוכן כפול מהסוג הראשון – תוכן זהה שמופיע בדפים בעלי URL שונה באותו אתר, לרוב ללא ידיעת בעלי האתר.
זו הגדרה כללית מאד, כי ישנם מצבים מגוונים של כפילות תוכן ויש להם משמעויות והשלכות שונות בראיה SEO-ית. אבל כלליות ההגדרה טובה כדי לגזור ממנה את העיקרון המנחה של Google בהתייחס לתוכן כפול: עדיף לא לבזבז עליו זמן (מקום טוב להתחיל את הקריאה כדי להבין את המדיניות של גוגל: הדף Duplicate Content ב-Webmaster Central).
כי אם דפים/אתרים שונים כוללים תוכן זהה בשביל מה לאנדקס ולהציג אותם לגולש? אף אחד לא אוהב להקליק על מספר לינקים רק כדי להגיע לאותו תוכן משוכפל. גם לא גוגלבוט. להמשיך לקרוא ←