לאחרונה מצאתי פרצת במקום בו יש יותר ישראלים מכמות המבקרים הישראלים בשנה בתאילנד – פייסבוק!
מכיוון שהפרצה קשורה לתופעת “שכפול תוכן”, אסביר תחילה איך גוגל מזהים ומתמודדים עם הבעיה הזו. הכל נובע מהמשוואה (הישראלית) הבאה: אני רוצה להתקדם בגוגל (וואלה? ומי לא?) + גוגל אוהב תוכן (התוכן הוא הרי המלך באינטרנט…) + אין לי כסף\זמן מיותר = בואו נעתיק מאחרים!
הקושי בזיהוי תוכן משוכפל
אחת הבעיות הגדולות של גוגל היא ההתמודדות עם שכפול תוכן. הרי לא ייתכן ששני בעלי אתרים שונים יהנו מפירות שקטפו מאותו עץ תוכן. אז מי יהנה מהפירות? רק זה שהתוכן שלו. ואיך אפשר לדעת של מי התוכן? פשוט מאד- מי שהתוכן התאנדקס ראשון אצלו, כנראה שפרסם אותו ראשון ולכן סביר להניח שהתוכן שלו. (בגוגל.קום לאחר שהשכפול זוהה, בנוסף גם מופעלים פילטרים שמסננים תוכן משוכפל בתוצאות החיפוש, עבור שאילתות הגולשים).
נכון להיום זו האינדיקציה שעל פיה נקבעת בעלות על תוכן מבחינת גוגל, רק חבל שלצערי היא לא תמיד עובדת. והנה כמה דוגמאות סותרות:
- לאתר A יש PR8, לאתר B יש PR2. בעל אתר B כתב מאמר חדש באתר שלו. יום למחרת בעל אתר A ראה את המאמר שכתב בעל אתר B ומיד חשקו עיניו – מהר עשה COPY+PASTE לאתר שלו והנה, כמה כיף לקבל מאמר איכותי לאתר שלי בחינם. סביר להניח שבגלל PageRank גבוה תדירות הסריקה תהיה גבוה יותר במקרה של אתר A – לכן כנראה שיסרק ראשון אצל אתר A, וכך מבחינת גוגל אתר B בעצם העתיק את המאמר מאתר A ולא להיפך….מעצבן? גם אותי! אבל זה מה יש.
- עוד דוגמא מעצבנת לא פחות מובילה אותי למקרה הבא: בעל אתר בנושא A מחפש אתרים שקשורים לנושא A, ואז לפתע הוא נתקל באתר בנושא A שבנויי כולו בפלאש. מהר, מבלי להרהר יותר מדי משכתב בוורד את כל המאמרים האיכותיים שמוצא שם באתר (20 דק’ פר מאמר למי שיודע הקלדה עיוורת). והנה, מאמרים חדשים היישר מהתנור לאתר, בחינם! כעת, כאשר יום אחד ישכיל בעל אתר הפלאש לשדרג את אתרו ל- HTML כפי שמקובל, כדי להפוך אותו לקריא עבור מנועי החיפוש – ייתקל בבעיה. המאמרים שיכתוב כבר אונדקסו מזמן אצל בעל אתר בנושא A וכעת הוא ייחשב בתור הגנב בעיני גוגל. אז נכון שאם מדובר בשני אתרים גדולים ורציניים, יוכלו להגיע לעמק השווה ואף איום לתביעה ייגרום לו להוריד את האתר הגנוב, אבל בואו נודה באמת – אם היה מדובר באתרים רציניים הם לא היו מתעסקים בזה! מדובר לרוב באתרי MFA (ראשי תיבות של Made For Adsense – אתרים שלא מתחדשים בקביעות ומדי פעם מוסיפים תוכן, מטרתם – רווחים מאדסנס בלבד).
יש כמובן עוד אינספור דוגמאות מהסוג הזה, אך מה שאני בעצם מנסה להגיד זה שהנושא הזה קצת “חלקלק”, לא באמת אפשר תמיד לקבוע חד משמעית “תכלס” של מי המאמר. ואם זה נושא כה עדין, לא יהיה הוגן להעניש אתר שאולי לא מגיע לו עונש. זו גם הסיבה שעל שכפול תוכן, מנועי החיפוש וגוגל בפרט לא מענישים. אומנם זו בהחלט שיטת קידום אתרים לא אתי, אבל אף אחד לא ייקח את האחריות לטעות בענישה. גוגל אומנם לא ייתן קרדיט לאתר שחושד כי שכפל תוכן, אך הוא ללא ספק לא יעניש אותו.
(כמובן שיצירת אתרי מראה, כפי שהצגתי בעבר, לא נחשבים מבחינתי שכפול תוכן במקרה שאני מציג. כלומר זה כן שכפול, אבל אני מתכוון למקרה בו צד A העתיק מצד B).
פרצת שכפול תוכן בפייסבוק
בכל מקרה, נחזור לפרצה שמצאתי בפייסבוק. מסתבר שרוב הדפים האישיים, פרופילים, קבוצות וארועים לא מתאנדקסים ע”י גוגל (כנראה שמארק בכוונה הגדיר ככה כדי לא לאפשר קידומים באמצעות לינקים). מה שקורה זה שכל התוכן שכתוב באותם דפים, מוגש חופשי על מגש של כסף לבעלי אתרים אחרים – קחו, תעתיקו ואף תחזקו את כוח אתרכם בתוכן רלוונטי!! (גוגל הרי קובע בלעדיות על סמך האינדוקס, ומכיוון שמדובר בדפים שלא מתאנדקסים, העתקת התוכן תהיה בלעדית למעתיק). אחלה עסקה לא?
וזו רק דוגמא לאתר אחד – מה עם אתרים חברתיים וקהילתיים אחרים בהם הדפים לא מתאנדקסים? יש הרבה רשתות חברתיות מהסוג הזה…פשוט צריך לחפש היטב.
איך גיליתי את העניין?
פתחתי גרופ בפייסבוק בנושא קידום אתרים בגוגל לפני כמה שבועות. כעבור שבועיים אני מגלה שאיזה מקדם אתרים העתיק ממני את מאמר הפתיחה לאתר שלו, אחד לאחד – פשוט עשה קופי פייסט החוצפן! (די השקעתי בו אני חייב להודות). למזלי אני מכיר את השותף שלו, כך שהמאמר ירד כעבור יום. אבל רק לצורך ההמחשה – אם המאמר היה מספיק להתאנדקס אצלו באתר, לא הייתי מקבל ממנו שום תועלת אם הייתי רוצה בעתיד להשתמש בו לצרכי האישיים.