לפני מספר ימים הפנה אותי ידיד וותיק לבעיה מעניינת, שאותה לא הצלחתי לפתור עד כה. אבל אני עובד על זה…
כמובן שבסוף, אולי אצליח איכשהו לשחד אותו (תמורת איזה לינק איכותי 🙂 ) לגלות את הפתרון ואפרסם אותו כאן.
בכל מקרה, לאחר פרסום פוסט זה, אני לא אציג את התגובות עד שאפרסם את הפתרון (כרגיל בנוהל). אגב, כפי שהבטחתי החידה הפעם בדרגת “קשה“… ENJOY!
mxak.org הוא אתר שכותרתו היא:
ואכן, מדובר בארגון ללא מטרות רווח, שהוקם במטרה לשרת את קהילת הימאים באלסקה. באתר יש מידע ושירותים, לצורך ייעול שיטות העבודה, חדשות מהתחום ותוכן נוסף שמטרתו לסייע במניעת סיכוני בטיחות. אבל מה שכן מוסווה היטב ולא ניתן להבחין בו כלל, היא העובדה המפתיעה כי באתר ישנו כלי שמאפשר יצירת דפי ואתרי מראה (!). כן כן, שכפול תוכן של דף או אתר שלם. קצת מזכיר את דף המראה של מקרה אולג’ובס עליו הוענש…
איך משכפלים דפים באמצעות אתר זה?
פשוט מאד, יש להדביק בשורת הכתובת את הביטויי הבא:
www.mxak.org/default.cfm?res=762&Company_id=648441&PageUrl=//
ולהוסיף לאחר שני הסלאשים את כתובת הדף אותו רוצים לשכפל. הנה דוגמא לשכפול של הבלוג שלי:
www.mxak.org/default.cfm?res=762&Company_id=648441&PageUrl=//
www.askpavel.co.il/blog/
ניתן לשים לב כי גם הקישורים שבגוף האתר המשוכפל שנוצר, מובילים לדף משוכפל פנימי עם כתובת חדשה שנוצרה. הבעיה היא שדפים משוכפלים אלו מתאנדקסים בקלות (אם מקשרים אליהם מאיפשהו), וכך למעשה ניתן ליצור מקור משוכפל פיקטיבי. ולראייה, ניתן להיווכח לאלפי אתרים מאונדקסים ששוכפלו בדרך זו:
איך שכפול שכזה יכול לפגוע בי?
אומנם נדרש מאמץ וכושר זריזות לשם כך, אבל בהחלט אפשרי לפגוע במתחרים באמצעות שימוש בשיטה זו. נניח שהמתחרה שלי יצר תוכן כלשהו באתר שלו, לדוגמא מאמר מקצועי. אם אספיק ליצור דף שכפול בדרך זו ולקשר אליו ממקור כלשהו (שנסרק בתדירות גבוהה ע”י הבוטים) כך שיתאנדקס לפני המאמר המקורי – הרי שהמאמר המקורי עלול להיחשב כשכפול תוכן בעיני גוגל. כך שלמעשה האתר המקורי, זה שיצר את המאמר, לא יקבל ערך SEO מוסף ממנו כלל. באסה!
ולסיכום, הנה החידה:
איך אפשר לחסום את השירות הזה בקוד של אתר כלשהו (אני מניח שזה דורש ידע בתכנות), כך שלא ניתן יהיה לשכפל ממנו דפים כלל?
תוספת:
פתרון
מצטער על העיקוב, היה לי קצת עומס בימים האחרונים. כעת, לאחר מתן הזדמנות לחשוב על הבעיה, אני יכול לפרסם את הקרדיט למקור החידה (תודה ג’קי). המקור מכיל את כל ההסבר לתופעה.
הפתרון הוא הוספת קטע קוד (ברמת השרת).
דוגמא: את הדף הזה: seo-simple.co.il/af-tools.asp, לא ניתן לשכפל בשיטה שהצגתי.
הפותרים:
עידן בן אור
הדר גיל-רועי
oxeleo (חסרה כתובת אתר)
אלברט אמיר