כולנו יכולים להסכים על כך שלגוגל יש את אחד האלגוריתמים הטובים, אם לא הטוב ביותר בעולם למיון של רלוונטיות תוצאות החיפוש. אמנם בישראל מנוע החיפוש לא מתוחכם כמו בארה”ב, אך אין ספק שהמגמה מתפתחת גם אצלנו לעבר מנוע חכם שיודע לזהות תוך פחות משנייה – אילו תוצאות חיפוש הן רלוונטיות לנו, ואילו פחות.
אומנם תהליך קידום אתרים נשען על למעלה מ-200 פרמטרים אשר משפיעים על עוצמת הדירוג של דף מסוים במנוע, אך ישנם פרמטרים שמשפיעים יותר מכל על הדירוג שלכם – לפחות כפי שגוגל מספרת לנו. אז לפני שבוע גוגל יצרה את “המדריך המהיר” לכל מי שרוצה לדעת מהן מערכות הדירוג האוטומטיות בגוגל. “מערכת” יכולה להיות אלגוריתם אחד או אוסף אלגוריתמים עם מטרה משותפת.
בואו ונעבור על כמה מן הפרמטרים שמשפיעים על דירוגים בתוצאות החיפוש של גוגל ונבין איך מערכות הדירוג עובדות.
BERT: מילות מפתח – OUT, משמעות – IN
מערכת BERT, שיודעת להבחין בין צירופי מילים ולהבין את משמעותן, עוזרת לגוגל ליצור קשרים טקסטואליים ולספק תוצאות חיפוש טובות יותר. בארה”ב המערכת הזו כבר נמצאת בשלבי פיתוח יחסית מתקדמים יותר מכאן בארץ, אך גם אצלנו – כל מי שמעוניין לדרג בגוגל, לא חייב (ולעתים אף רצוי) לשבץ את מילת המפתח בדיוק כפי שהיא, אלא בויריאציות שונות בעלות אותה משמעות. במידה והתוכן באתר שלכם רלוונטי במשמעותו לשאילתות שאנשים מחפשים, סביר להניח שהוא ידרג בהן גם אם מילת המפתח לא זהה באופן מלא למילות המפתח הנפוצות שאנשים מחפשים.
מספקים מידע שעשוי לסייע בשעת משבר? קודמתם.
במסגרת הפיתוחים האחרונים של גוגל, האלגוריתם Crisis information systems מזהה באמצעות בינה מלאכותית מתי מתרחשים אסונות כגון רעידת אדמה, צונאמי, משברים אישיים ועוד ויודע לספק התאמות לכך בחיפושים במנוע. השינוי נולד מתוך הרצון לספק עזרה ושקט נפשי בעתות משבר – החברה פעלה ועדיין פועלת כדי לפתח עבור המשתמשים מערכות שמסייעות למציאת מידע מועיל על אירועים שכולם צריכים לדעת עליהם.
מעבר לכך, אם תחפשו שאילתות הקשורות לנושאים שעלולים לסכן חיים, כגון התאבדות, תקיפות מיניות, בקרת רעלים, התמכרות לסמים ועוד – האלגוריתם של גוגל שנועד לתת תגובה למשבר יספק לכם טלפון של “הקו החם” הרלוונטי על מנת שתוכלו ליצור איתו קשר במהירות הנדרשת.
סוגי המשברים, על פי גוגל מתחלקים ל-2 סוגים:
- משברים אישיים: המערכות של גוגל יודעות לזהות מתי אנשים נמצאים במצוקה ולעזור להם. לדוגמה: אם תחפשו בגוגל את צמד המילים “איך מתאבדים” תוכלו לראות מיד את המספר 1201 (ער”ן) מופיע על המסך ואת התוכן הרלוונטי ביותר שיעזור לכם להתמודד עם המשבר (ולאו דווקא את התוכן המדויק שעונה לשאלה הספציפית). זה תקף גם למשברים אישיים אחרים כמו פגיעה מינית, בליעת רעלים, אלימות בזוגיות/במשפחה והתמכרות לסמים. ניתן לקבל עוד מידע בנושא כאן.
- התראות SOS: הסוג השני של משברים שגוגל הגדירה ככזה שהיא מסייעת בו הוא משברים שקורים בעולם. במצבי שיטפונות, שריפות, רעידות אדמה, הוריקנים ואסונות אחרים המנוע מיד יודע להציג את המידע הרלוונטי בחיפושים, ולתת מידע מהימן מאתרי חדשות שעוזר להתמודד עם המשבר. כמו כן, אם תחפשו בשעת משבר עולמי שאילתה הקשורה אליו, ייתכן מאוד שתקבלו על המסך מספר טלפון של הרשויות המקומיות הרלוונטיות שיעזרו לכם להתמודד איתו.
מערכות למניעת כפילות דפים
תוכן איכותי ומקורי הוא לא דבר זול, ובדרך כלל הוא לוקח יותר זמן לכתיבה. בעלי אתרים רבים בוחרים לכתוב את התוכן באמצעות שימוש בכותבי תוכן שמשתמשים ב”רפרנסים” – כלומר, מגוון מקורות מידע שמהם ניתן להרכיב מאמר חדש בעל ערך מוסף לקורא: יכול להיות שהערך המוסף הוא מאמר מעניין יותר, מאמר שממוקד לטובת גולשים המחפשים מענה על שאלה אחרת ממקורות המידע ועוד. כמובן שהמאמרים האלה בנויים בצורת סיכום של הנאמר ואסור שהם יהיו מועתקים (אפילו לא במשפט אחד). אך כמו בכל דבר, יש כותבים או בעלי עסקים שלקחו את זה צעד רחוק מדי, ומעתיקים מקטעים שלמים מדפים אחרים או כותבים מאמרים שזהים כמעט לגמרי במהותם למאמרים אחרים – הן מבחינת מבנה כותרות המשנה, מבחינת הכתיבה עצמה ועוד. האם יהיה הוגן שתוכן מועתק יקבל קידום בדיוק כמו זה שכתב את המאמר המקורי? ודאי שלא.
בגוגל סבורים שזו כבר תופעה, והאלגוריתמים שלהם כיום (Deduplication systems) נלחמים בה יותר מאי פעם. לכן, השתדלו ככל האפשר שהתוכן באתר שלכם יהיה מקורי ושונה במהותו ממאמרים אחרים המופיעים בתוצאות החיפוש לצידכם.
מערכת למקוריות התוכן
בדומה למערכת הקודמת, לגוגל יש מערכת נוספת שבודקת האם התוכן שיצרתם הוא מקורי – בדגש על איזה אתר יצר את התוכן ראשון.
עוד באותו נושא:
- כתיבת תוכן שמביאה תוצאות: המדריך היחיד שצריך לקרוא
- מה זה תוכן משוכפל ומדוע כדאי להימנע ממנו?
- מה מותר ומה אסור בהעתקת תוכן באינטרנט מבחינת זכויות יוצרים?
מערכות לבדיקת דומיין
המערכת של גוגל “Exact match domain system” סורקת גם את שם הדומיין כדי לוודא שהוא תואם למילות המפתח המחופשות על ידי המשתמש. רבים חושבים שמה שמשפיע על דירוג התוכן באתר הוא דווקא התוכן עצמו, וזה נכון – אך גוגל מספרים לנו שהם אכן מתחשבים במידה מסוימת בשם הדומיין. יש לסייג ולומר מנגד, שהם לא מייחסים לכך יותר מדי חשיבות.
תוכן טרי מקבל אהדה
גוגל מציינת שיש לה מספר מערכות לבדיקת “טריות התוכן” (Freshness systems). למה זה בכלל חשוב? אם מישהו מחפש לראות ביקורות על הסרט החדש שיצא לפני שהוא הולך לראות אותו, סביר להניח שהוא יעדיף לראות את הביקורות על הסרט במקום מידע ישן שעלה באתרים שונים, לפני שהסרט בכלל יצא. מסכימים? כמובן, הדבר תלוי בקונטסט, וזה גם משהו שגוגל מנתחת, בין היתר כדי לעזור בשעות משבר וגם למטרות אחרות כמו אלה.
מדד “תוכן שעוזר לאנשים”
המערכת Helpful Content מזהה ע”פ אלגוריתמים שונים מהי חווית המשתמש שאנשים יוצאים איתה מהדף, ובהתאם לכך יודעת איזו פיסת תוכן מספקת את האינפורמציה הכי טובה.
ניתוח קישורים ודירוג עמודים
רבות נאמר כבר על אלגוריתם ה-PageRank לדירוג עמודים בגוגל, אך עד כמה הוא רלוונטי היום?
בעבר ציון ה-PageRank היה גורם שמשפיע המון על דירוג עמודים, והיום הוא תופס תפקיד מעט פחות משמעותי – אך הוא עדיין גורם שמשפיע על הדירוג שלכם בגוגל ולא מומלץ לזלזל בו.
בכל הקשור לניתוח קישורים, לגוגל יש מערכות שונות שסורקות את הדפים שלנו כדי להבין באיזו שפה ותוכן הם עוסקים, עד כמה הם מעניינים את הגולשים ועוד. אלגוריתם ה-PageRank מהווה רק חלק מכל המערכות הללו.
מערכת “חדשות מקומיות”
לגוגל יש מערכת בשם Local news systems, שעוזרת לזהות אילו אתרי חדשות הם הכי רלוונטיים במיקום מסוים בארץ ובעולם, ויודעת להציג את התוכן הרלוונטי באתרים אלה.
מערכת להבנת השפה
מערכת הבינה המלאכותית MUM (ראשית תיבות Multitask Unified Model), זו מערכת שיודעת להבין את השפה ולנתח הקשרים ומשמעויות באופן עמוק יותר מהמערכות הקיימות היום. היום MUM עדיין לא בשימוש לטובת חיפושי גוגל חוץ ממקרים ספציפיים מסוימים.
“התאמה נוירונית”
עוד מערכת מבוססת על בינה מלאכותית בשם Neural matching, שיודעת להבחין אילו דפים קשורים אחד לשני ובהתאם לכך לבצע שינויים רלוונטיים בדירוגים בתוצאות החיפוש.
מדיניות הסרות
מערכת “Removal-based demotion systems”, אשר מסירה דפים מסוימים אם הם אינם תואמים למדיניות של גוגל, כאשר היא רואה שהיא מסירה (היא = האלגוריתם) כמויות גדולות מדי של תוכן לאתר מסוים, זהו סימן אזהרה לאותו אתר – והיא עשויה “לקנוס” את אותו בעל אתר בירידה בדירוגים. קיימים 2 סוגי הסרות:
- הסרה על בסיס חוקי: מתקבל בעקבות כמות גדולה של דיווחים על בסיס עבירה על זכויות יוצרים. בדרך זו, אם יש תוכן מפר אחר, יש סיכוי נמוך יותר שאנשים יתקלו בו לעומת התוכן המקורי. גוגל מיישמים סימנים דומים להורדה בדרגה על תלונות הכוללות לשון הרע, מוצרים מזויפים והסרות בצו בית משפט.
- הסרה על בסיס מידע אישי: קורה כאשר גוגל מעבדים כמות גדולה של הסרות מידע אישי הכוללות אתר עם נוהלי הסרה “נצלניים”. גוגל גם בודקים בודקים אם אותו דפוס התנהגות מתרחש באתרים אחרים, ואם כן, מבצעים הורדות בדרגה על תוכן באתרים אלה. יתרה על כך, לגוגל יש הגנות אוטומטיות שנועדו למנוע מתמונות אישיות מפורשות שלא בהסכמה לדרג גבוה בחיפוש שאילתות הכוללות שמות.
דירוג “מעברים”
גם מבנה של דף הוא חלק חשוב בזיהוי האלגוריתם של גוגל. החברה פיתחה מערכת בינה מלאכותית בשם Passage ranking system, שבה היא משתמשת כדי לזהות קטעים בודדים או “קטעים” של דף אינטרנט כדי להבין טוב יותר עד כמה הוא יהיה רלוונטי למשתמש.
באמצעות מערכת Passage, גוגל יכולה להבין שהתוצאה מימין הרבה יותר רלוונטית לשאילתה ספציפית מאשר עמוד עם מענה רחב יותר בנושא. במקרה זה, המערכות של גוגל הצליחו להדגיש קטעים בטקסט המוצג עם מענה מדוייק יותר בשלב תוצאות החיפוש.
סקירות מוצרים
לגוגל חשוב להציג מוצרים באיכות גבוהה בחלון הראווה המוצג בראש תוצאות החיפוש והיא נשענת על מערכת Product reviews system. תוכן שיודע לספק תובנות, מחקר מקורי ו/או נבדק על ידי מומחים מקבל קידום.
מערכת RankBrain
מערכת RankBrain היא מערכת שעוזרת לאלגוריתם להבין אילו מילים קשורות למילים נרדפות – התועלת בתוצאות החיפוש מתבטאת בכך שהתוצאות יהיו רלוונטיות, גם אם מילת המפתח לא זהה “אחד לאחד” למקור.
מערכות לבקרת אמינות
כפי שכבר הבנתם, אמינות הדפים בשביל גוגל היא עניין די מהות. מערכת בשם Reliable information systems, פועלת כדי להציג את המידע המהימן ביותר האפשרי, בדרכים כמו קידום דפים “סמכותיים” יותר כמו עיתונים, אתרים שמפנים אליהם לינקים רבים מדפים אחרים ועוד.
מערכת גיוון אתרים
בדרך כלל, גוגל לא יציגו יותר מ-2 מופעים של אתר אחד בתוצאות החיפוש – כך שלא יווצר מצב של “השתלטות” של אתר אחד על תוצאת החיפוש בגוגל. עם זאת, במקרים בהם זה רלוונטי יש גם כאן יוצא מן הכלל.
בתור בעלי אתרים/מקדמי אתרים, בשל מערכת Site diversity system, מומלץ להקפיד על גיוון במילות המפתח שאתם מתמקדים עליהם, כדי שהאתר לא ידרג פעמיים באותה מילת מפתח.
מערכות לזיהוי ספאם
לגוגל יש מספר מערכות שיודעות לזהות האם אתר מסוים הוא “ספאמי” (Spam detection systems). מוזמנים לקרוא מאמר נפרד שגוגל כתבה עם הדרכים בהם היא נלחמה בספאם בשנת 2021.
מערכת חווית עמוד
אנשים מעוניינים להיכנס לאתרים בעלי חווית משתמש טובה. המערכת של גוגל Page Experience System, מחפשת דברים שונים הקשורים לחווית המשתמש, כגון: עד כמה מהר הדפים נטענים, אם התוכן מציג מודעות ביניים המפריעות לחווית הגולש והאם האתר מוגש בצורה מאובטחת. ככל שחווית המשתמש טובה יותר, על פי האלגוריתם – כך האתר שלכם ידרג במיקום גבוה יותר.
מערכות ישנות שעדיין נמצאות בשימוש נרחב
לגוגל יש מספר מערכות מצוינות לקביעת רלוונטיולת של דפים והנגשתם לגולש, כגון: מערכת “יונק הדבש” (2013), מערכת התאמת הדירוגים למובייל, מערכת לבדיקת מהירות עמוד (2018), עדכון “פנדה” הגדול (2011) לבחינה של דפי אינטרנט איכותיים, פינגווין (2012) ומערכת “אתרים מאובטחים” (2014) שעודדה לראשונה בצורה נרחבת את השימוש ב-HTTPS – כשהוא עדיין לא היה נפוץ.