בימינו כל אחד יכול להרשות לעצמו אתר אינטרנט. כשמערכות לניהול תוכן מופצות חינם באינטרנט ואפילו העיצובים נגישים לכל דורש, עם כמה שקלים על אחסון ודומיין אפשר להקים יופי של אתר בשניות (וגם כזה שיוכל להכניס כמה ג’ובות בחודש). אבל מה קורה אם רוצים להקים יותר מאתר אחד? האם זה לגיטימי בכלל להקים אתר תמיכה X שכל תפקידו הוא לחזק את אתר Y מבחינת SEO? (זו שאלה רטורית 🙂 ). ואיפה עובר הגבול הדק שבין אתרי תוכן איכותיים ולגיטימיים לבין חוות קישורים בפוטנציה? (זו לא). תמשיכו לקרוא, כל התשובות בהמשך.
מה הבעיה עם “אתר תמיכה” מבחינה אתית?
אז הקמתי אתר מצליח והוא אפילו מכניס לי סכום נאה של כסף מדי חודש. הגיע הזמן להמשיך הלאה, להקים עוד אתרים נכון? המחשבה הזאת מתבקשת וזה לגיטימי. הבעיות מתחילות כאשר האתרים הנוספים שנבנים, נוצרים במטרה לחזק מבחינת SEO את האתר המצליח הראשון, או קבוצת אתרים מצליחה בתוך “הרשת”. כלומר יצירת אתרים חסרי תכלית או ערך מוסף לגולש, במטרה להוציא מהם קישורים ותו לא.
המקרה הסביר הוא בניית אתר תוכן איכותי חדש שייתן ערך אמיתי לגולשים. על הדרך אני גם אציין בו שהוא משתייך לקבוצת האתרים שלי ע”י הוספת קישורים אל שאר האתרים בפוטר (כמו שדפי זהב עושים למשל). ואז יש לי רשת איכותית ומקושרת – לגיטימי. אבל יש להימנע בכל תוקף מהמקרה השני בו האתר נבנה רק כאתר תמיכה, ומנוצל בצורה ברוטאלית להוצאת קישורים מכל דפי התוכן באתר. אל תזלזלו בגוגל, הוא יכול בקלות לזהות את הקשר בינו למקורי ולתייג את כל הרשת כולה כ”חוות קישורים” (שיטה לא אתית עליה כתבתי בהרחבה בפוסט על קידום בשיטת הכובע השחור). אגב, קיים ייחס טרנזיטיבי בכל הנוגע למציאת קשרים בין אתרים. כלומר אם נמצא קשר ישיר בין אתר A לאתר B וגם נמצא קשר בין אתר B לאתר C – אוטומטית מיוחס קשר בין אתר A לאתר C.
חשוב להבהיר שכל סעיף בפני עצמו מתוך הסעיפים הבאים שאציג לא יכול לגרום לפסילה. ייתכן שגם שילוב של כל הסעיפים יחד לא יכול להבטיח ב-100% שתהיה ענישה. יחד עם זאת, זה מספק לגוגל מידע נוסף אודות האתר שלכם. ועם הצטברות של תיוגים נוספים מהסוג הזה, רק יגדיל את הסיכויי שיום בהיר אחד תקומו בבוקר ולא תראו את האתר שלכם יותר בתוצאות החיפוש.
אז איך גוגל מזהה קשר בין 2 אתרים (או יותר)? לפניכם 5 דרכים שמסייעות לו להבין אם קיים קשר ביניהם:
1. ה”אסימון” הלא גנרי הימני ביותר בדומיין – זהה
כדי להבין את הסעיף הזה, שהוא מעט טכני וקשור לאלגוריתמיקה, הבא נצלול אל מעמקי המסמך המקורי של אלגוריתם ה- Hilltop (אשר נכתב ע”י Krishna Bharat לפני מספר שנים בזמן לימודיו בקנדה). לא אפרט כאן על האלגוריתם והבעיה שהוא אמור לפתור, זה נושא מעניין שמצריך פוסט בפני עצמו. אך אציין כי הייתה שם פסקה חשובה מאד שהתייחסה לכל נושא הזיהויי של האפיליאציה (שיתוף פעולה) בין אתרים באינטרנט. זהו רמז משמעותי שמקרב אותנו לדרך בה גוגל חושב ויש לקחת אותו בחשבון. למה אפשר להסתמך על מה שכתוב שם? כי ידוע לנו שגוגל הטמיעו את Hilltop באלגוריתם שלהם בערך בשנת 2004 (מה שגרם גם לרבים בזמנו להבחין לראשונה באפקט “ארגז החול” המפורסם. למעשה Garrett French היה הראשון שהבחין בכך).
אוקיי ניגש לסעיף עצמו. נגדיר “אסימון” (Token) בתור תת מחרוזת כלשהי בשם הדומיין, אשר לפניה ואחריה יש נקודה. לדוגמא בדומיין: www.ynet.co.il המילה ynet היא אסימון. כמו כן גם www, co ו- il הם אסימונים. אז מה זה אסימון גנרי? רצף מתוך דומיין הוא גנרי אם האסימונים שמרכיבים אותו (או אסימון אחד), מופיעים במספר רב של דומיינים ברחבי הרשת. לצורך העניין האסימונים com או net מופיעים בהרבה דומיינים בעולם, לכן הם גנריים. גם articles או page לצורך העניין.
הבא נבדוק באמצעות העקרון הזה האם לדומיין http://kamaze.zap.co.il/Cellular/Default.aspx יש קשר לדומיין http://www.kamaze.co.il/Site/HomePage/Default.aspx מבחינת גוגל (האתרים הללו אגב לגיטימיים לחלוטין, זו רק דוגמא). ראשית נפחית מכל אחד מהם את האסימונים הגנריים (אלו שנפוצים ומופיעים בהרבה מאד דומיינים ברשת) ונשאר בדומיין הראשון עם המחרוזת: kamaze.zap בשני נשאר רק עם kamaze. אפשר לראות בבירור שחלק מהמחרוזת השניה מוכל בראשונה ולהיפך ולפיכך ניתן להסיק שיש קשר בין 2 הדומיינים.
2. שלושת הצירופים הראשונים בכתובת ה- IP זהים
זוהי הדרך השניה לאבחן קשר בין 2 אתרים עפ”י המסמך המקורי של ה- Hilltop. כתובת ה- IP היא מספר ייחודי המסייע בזיהוי מחשבים ברשתות תקשרות כגון האינטרנט ובעלת מבנה ואורך קבוע. כל כתובת IP מורכבת מ-4 קבוצות של מספרים, (לדוגמא: 216.27.100.36) כאשר כל קבוצת מספרים היא בגודל 8 ביט (הרחבה על כתובת IP מתוך וויקיפדיה). במסמך על Hilltop נכתב במפורש כי מזוהה קשר בין 2 דומיינים כאשר שלושת קבוצות המספרים הראשונות של כתובות ה-IP שלהם זהות.
3. קישורים נכנסים מאתר עם אותו C-Class
בהמשך לסעיף הקודם, המספר השלישי משמאל בכתובת ה-IP נקרא C Class. לדוגמא במקרה של כתובת ה-IP 216.27.100.36 ה- C Class הוא 100. כאשר אתרים מאותו תחום האחסון בעלי אותו c class מקשרים אחד לשני זה מדליק אצל גוגל נורה אדומה ומפחית משמעותית מערך הקישורים. כפי שעידן ציין, זה משקף ששני האתרים שייכים לאותה “המשפחה” וגוגל לא נוהג להעלות בתוצאות החיפוש שני אתרים מאותה “המשפחה”, אשר מתחרים על אותו הביטוי.
אתן דוגמא אישית של גולש אשר פנה אלי לאחרונה עם מקרה כזה. יש לו קבוצת אתרי ביטוח ושניים מהם יושבים על אותו האחסון ובעלי אותו C Class. הוא לא ממש ייחס חשיבות לכל הנושא הזה כאשר תכנן את אסטרטגיית בניית הקישורים באתרים שלו והחליט לקשר מאתר A ל-B. זה גרם לכך שלאט לאט אתר A התחיל לרדת בתוצאות האורגניות (בהתחלה הוא היה במקום החמישי בדף הראשון) ונכון להיום הוא כבר הרבה מעבר לדף העשירי (!). כמובן שהדבר הראשון שייעצתי לו לעשות זה להסיר את הקישור הזה ולקוות לטוב. אבל כפי שאתם רואים, ההשלכות הרסניות במיוחד.
4. קישורים נכנסים בתדירות גבוהה ובעלי אופטימיזציה מוגזמת
אז נניח ש-2 האתרים ממוקמים על C Class שונה, האם זה מוריד את החשד? לא בדיוק.
ישנו מונח כזה שנקרא over optimization (יותר מדי אופטימיזציה), אשר מאפיין מקרים בהם נעשית אופטימיזציה מוגזמת באתר עצמו ו\או בקישורים מאתרים חיצוניים שמפנים אליו. כאשר המצב הזה מתקיים לאורך זמן (מה שיכול גם לגרום לענישה של האתר בתוצאות החיפוש), זה יכול לתייג את האתרים כשותפים. הבעיה היא שמקדמי אתרים לעיתים נוטים לחשוב בצורה SEOית מדי וזה גם מה שמפיל אותם בסופו של דבר.
למה אני מתכוון? נניח שיש לי אתר צימרים מאד מצליח ואני מחליט להקים אתר תמיכה רק לצורך חיזוק האתר המקורי מבחינת SEO (במסווה של אתר שגם כן משווק צימרים בפני עצמו). המטרה שלי היא לחזק איתו את הדפים הבאים:
- A – על הביטויים: “צימרים בצפון”, “צימר בצפון”
- B – על הביטויים: “צימר מומלץ”, “צימרים מומלצים”
- C – על הביטויים: “הנחה לצימר בצפון”
אז מה שבעל האתר עושה זה לקשר מכל עמודי האתר החדש לדפים הללו באתר המקורי, בדיוק בביטויי המפתח המרכזיים. כעת נעזוב לרגע את מנועי החיפוש. נניח שאני מראה לכם את האתר הנוסף, האם זה יראה לכם טבעי שהוא מקשר מכל הדפים שלו לדפים שונים באתר המקורי בדיוק בביטויים האלה? אני לא יודע, לי בתור גולש נראה מוזר מאד לראות קישור שבו כתוב “הנחה לצימר בצפון” בהרבה עמודים באתר אחד. קצת לא טבעי לטעמי. למה לא לכתוב “הנחה לצימרים של משה” למשל? או אפילו כמה קישורים בהם כתוב: לצימרים בחינם “לחץ כאן”. זה פשוט נראה כאילו נעשתה כאן אופטימיזציה מוגזמת.
ואני בכלל לא מדבר על העובדה שמדובר במתחרים ישירים, מה שגורם לי עוד יותר להרים גבה. מלבד anchor text זהה לאותם הדפים בדיוק, יש בעיה נוספת שכמות הקישורים גדלה כל הזמן משום שנוספים דפים באתר התמיכה. זה הופך את המצב לעוד יותר לא טבעי שהרי לבעל אתר לא אמור להיות אינטרס לקשר לאתר אחר (ועוד מתחרה) על בסיס קבוע.
5. אותו דפוס בתבנית העיצוב וקוד מקור זהה
מי מאיתנו לא מכיר את המקרה המצער בו אדם שלא התכונן למבחן מעתיק מהשכן, אבל בטעות גם מעתיק את השם שלו… לא נעים. עכשיו דמיינו לעצמכם מה יקרה אם לא רק השם יועתק אלא כל המבחן עצמו?
אני בטוח שלכל מי שעוסק בקידום אתרים באינטרנט ללא ספק יצא להיתקל ברשתות אתרים ספאמיות לחלוטין, שכל אתר בהן פשוט נראה אותו הדבר בדיוק. הדבר היחיד שהבדיל ביניהם זה הלוגו, הצבעים וחלק מהטקסט. חוץ מזה הכל אותו הדבר בדיוק: מערך הקישורים הפנימיים (מילים שונות אך הדפוס זהה), אלמנטים בדף והמיקום שלהם, כמות טקסט ופסקאות בדף, תגיות Meta ואפילו הפרסומות באותו המיקום בדיוק. אומנם זה יכול להראות קצת חשוד בעיני גוגל וכמובן ישר האתרים הללו יתוייגו עם דגל, אך זה עדיין לא עילה לפסילה. כמובן שזה כן יהיה לגיטימי אם כל אתר מהסוג הזה באמת מספק תוכן איכותי בנושא שנבחר. אך הבעיה מתעוררת כאשר בעל הרשת נעזר באתרים כדי לחזק את כל הרשת ע”י העברת קישורים בין האתרים הללו.
אפשר בקלות לאבחן אנולוגיה בין 2 אתרי אינטרנט באמצעות הצצה מהירה לקוד המקור. אך אין מה להיבהל, ידוע שישנן מערכות לניהול תוכן שמייצרות את אותו הקוד לאתרים, ומה שמשתנה זה רק התוכן והצבעים. לכן הסתייגתי ואמרתי שהבעיה מתחילה כאשר ישנם גם קישורים הדדיים בין האתרים ועוד בצורה שלא נראית טבעית (ראה סעיף 4).
איך לדעתכם גוגל מזהה קשר בין אתרים?
יש עוד הרבה מאד גורמים בהם גוגל נעזר כדי לזהות קשר בין אתרים ואני בטוח שהם לא צויינו כאן. הגורמים הללו פזורים ברמזים שונים שגוגל מפרסמים בבלוגים שלהם, רמזים שמט כץ זורק מדי פעם, או מסקנות מניסויים ומחקרים שאנשים בתעשיית ה-SEO עושים. אני אשמח מאד אם תשתפו כאן על כל ידע שיש לכם בנושא, על מנת שנדע לזהות את זה בזמן ולמנוע את ענישת האתרים שלנו.
התמונה באדיבות LShadrack