ניסוי של חברת DejanSEO הצליח לתפוס שתי ציפורים במכה ולהוכיח באמצעות ניסוי שלא רק שה-PR לא מת, אלא שעדיין קל מאוד לשכפל תוכן ולדחוק את האתרים המקוריים שפרסמו אותו למטה. בעבר אומנם הוזכרו פה שיטות לבדוק מי האתרים המקוריים שיצרו את התוכן, אבל השאלה היא מה אפשר לעשות במקרים כאלו כמו בניסוי הזה?
איך התנהל הניסוי?
הניסוי התחיל בכלל באופן תיאורטי בהסתמך על מסמך של שני מהנדסים מגוגל שעלה לרשת מתישהו ב- 2010 . במסמך נכתב שאם ישנם שני אתרים בעלי תוכן זהה, האתר בעל ה- PR הגבוה יותר יוצג ראשון ואף ינתב אליו את כל הקישורים שמפנים לאתרים אחרים בעלי אותו התוכן.
את התיאוריה הזו קל מאוד לבדוק באמצעות העתקת תוכן מאתרים בעלי PR נמוך ל- PR גבוה. זה בדיוק מה שהצוות עשה, ועל מנת להימנע מטעויות, הוא בחר ארבעה אתרים שונים (וכמובן שיתף בכך את האנשים שכתבו את התוכן המקורי). בשלב זה לא נעשה שימוש בתגי קנוניקל שנועדו לציין תוכן כפול, אבל כן נעשה שימוש ב- Authorship – תג שמקשר מסמכים אל הכותבים שלהם.
נקודה נוספת שתהיה לה חשיבות בהמשך היא שהתוכן עצמו הועתק אל סאב דומיין של Dejanseo.au שהוא אתר בעל סיומת אוסטרלית. למרות זאת, הוחלט לבדוק את התוצאות על גוגל.קום.
ואכן, התוצאות היו לא פחות ממדהימות. באתר הראשון שנבדק, האתר המועתק עקף את המקור תוך ארבעה ימים, גם כאשר הוקש אופרטור info שהפנה אל הדף המדויק (ראו תמונה):
בנוסף לכך, ה- PR האמיתי (שנבדק בזמן אמת) של הדף המקורי ירד ל- 0, ואילו של הדף המועתק קפץ ל- 4, למרות שהוא היה קיים ברשת פחות משבוע.
באתר השני נבדקו שתי שאילתות שונות, ואת מהן החזירה את הדף המועתק, הפעם תוך יום אחד בלבד.
בשלב הבא, הוסיפו לניסוי את תג הקנוניקל לדף המקורי. הפעם הדף המועתק הופיע לפני הדף המקורי רק בחיפוש של טקסט מהדף, אבל לא באופרטור info. לאחר מכן הוסרו כל סימוני ה- “פלוס אחד” מהדף המקורי, ותוך מספר ימים הוא חזר למקום השני.
השלב הבא והאחרון היה המאתגר ביותר מכיוון שהוא נעשה על הבלוג של ראנד פישקין, אחד מהאנשים הבולטים ביותר בסצנת ה- SEO העולמית, שהאתר שלו נחשב ללא ספק לאותריטה בתחום. גם כאן ההצלחה הייתה מרשימה יחסית: חיפוש של פישקין בגוגל אוסטרליה החזיר את האתר המועתק:
מה אפשר ללמוד מזה?
לבסוף, הצוות של DejanSEO מציג מספר מסקנות הנוגעות להגנה על תוכן כפול ולאתרים שגוגל בוחר בהם כ -“מקור”:
- נראה כי הדף שגוגל מחשיב למקור מקבל לא רק את כוח הקישורים של הדף המועתק, אלא גם את הסיגנלים החברתיים שלו אם ישנם.
- באותו אופן, קישורים שמפנים לאתר המקורי יכולים להופיע בכלי מנהלי האתרים של האתר המועתק (מסקנה זו אומתה לאחר החלק השני של הניסוי עליו לא הרחבנו).
- שיטות ההגנה הטובות ביותר הן קודם כל תג קנוניקל, לאחר מכן תג Authorship, לאחר מכן קישור דרך URL מלא בדפי האתר שרוצים להגן עליו (כדי שהאתר המעתיק יקשר לאתר המקורי), ורק לבסוף שימוש בתוכנות ידניות לבדיקת העתקות כמו CopyScape.
לסיום, המסקנה האישית שלנו היא שאין ספק שמדובר בניסוי סופר מעניין שחושף שוב פעם את העובדה שהאלגוריתם של גוגל בנוי בכמה וכמה רמות שאינן בהכרח באותה “רמה התפתחותית” (בדיוק כמו המוח האנושי). אמנם ה- PR נחשב לפרמטר “מת” בכל מה שקשור לדירוג של אתרים השונים אחד מן השני, אבל מסתבר שהוא עדיין מהווה עקב אכילס במקרים של אתרים מועתקים, גם אחרי 20 ומשהו עדכוני פנדה… המסמך עצמו אולי לא נראה כל כך מיושן, אבל 3 שנים הם נצח במונחים של מנועי חיפוש. הניסוי גם מאושש את העובדה שכנראה אף אחד בגוגל חוץ מהבכירים ביותר לא מכיר את כל השכבות השונות של האלגוריתם.
הבעיה האמיתית היא שבעוד מקדמי האתרים “הלבנים” משתמשים בניסויים האלו על מנת ללמוד כיצד לשפר את העבודה שלהם בצורה תחרותית, אנשים אחרים עלולים להשתמש במידע הזה לרעה ואף לבצע עימו תהליכי אוטומציה מסוכנים. מצד שני, סביר להניח שאלו בדיוק המקרים שבהם גוגל צריכה להודות למקדמי האתרים שלפעמיים עושים בשבילה את העבודה השחורה… מעבר לכך, מצחיק לחשוב שבעוד גוגל מנסה להגן על האלגוריתם שלה מכל משמר, מסתבר שמידע רגיש מאוד נמצא בתוך מאמרים שהיא עצמה העלתה לרשת… אולי המודיעין הישראלי היה יכול ללמד אותה כמה דברים 🙂
לדף הניסוי המקורי עם פירוט נוסף