אם ההודעה הבאה נראית לכם מוכרת, סימן שיצא לכם כבר לבקר בעמוד שגיאת 404 לפחות פעם אחת בחיים:
“העמוד שאתה מחפש לא קיים כאן. כנראה שהכתובת של הדף שונתה ולכן לא ניתן להגיע אליו”.
הודעת 404 היא: “קוד סטטוס של HTTP, שבעצם אומר שהלקוח (את\אתה) הצליח לתקשר עם השרת, אך השרת לא הצליח למצוא את מה שהתבקש על ידך” (מתוך וויקיפדיה). למעשה בעלי אתרים לרוב מגדירים עמוד ייעודי, אליו מופנה הגולש במקרה של נסיון להגיע לכתובת שאינה קיימת. לדוגמא: נסיון להקליד בשורת הכתובת בדפדפן כתובת לא תקנית, או הקלקה על קישור שמוביל לכתובת ישנה ולא פעילה (שבעליה לא דאג לעשות הפניית 301 לכתובת החדשה) וכו’.
משום מה מנהלי אתרים רבים לא מייחסים חשיבות לעניין. חלקם לא תמיד דואג להחזיר שגיאת 404 במקרים בהם העמוד לא קיים או להיות מספיק מנומסים ולהפנות את הגולש לעמוד שגיאה ייעודי. במקרים בהם הגולש כן מועבר לעמוד שגיאה, לעיתים העמוד המוצע בעייתי ולא שימושי. בפוסט הבא אנסה לדבר על מספר השלכות SEO וייעוד העמוד כאבן דרך בפונקציונליות ושימושיות האתר שלכם.
איך תעשו אופטימיזציה לעמוד 404?
קודם כל חשוב לציין שעל העמוד להראות כמו כל שאר העמודים שלכם באתר. על מנת לא לבלבל את המשתמש, ולגרום לו לחשוב שהוא יצא מהאתר, השאירו את העמוד כפי שהוא (כל התבנית נשארת, רק מה שבאמצע משתנה). בכדי לשמור על מבנה תקין, אני ממליץ שהוא יכלול את 5 המרכיבים הבאים:
- הודעת שגיאה מתאימה – עליכם להודיע לגולש בצורה כלשהי שהוא הגיע לעמוד שלא קיים.
- תיבת חיפוש – אחרי שזה כבר נודע לו, עליכם לאפשר לו לחפש אחר הדף שכן רצוי.
- גישה לתוכן מומלץ – בזמן שהוא חושב מה לעשות, הציעו לו את הדפים העיקריים באתר.
- קישור לעמוד הבית – במידה והוא לא בטוח בעצמו, תמיד ירצה נתיב בטוח לנקודה ההתחלתית.
- מפת אתר – לא חובה אך מספר מדריכים ממליצים לשים קישור בכדי לאפשר לגולש להגיע לצומת מרכזית.
אחזור ואדגיש שתכנון נכון של הדף, עשוי להציל אתכם מנטישה של הגולש ברגע של בלבול. חישבו עליכם כעל אותו הגולש שראה בתוצאות החיפוש איזו כותרת מגניבה והקליק עליה, אך כשהגיע לאתר הוא נתקל בהודעת שגיאה. הפעולה הראשונה שיחשוב עליה זה ללחוץ על back בדפדפן. עליכם לעשות הכל בכדי לגרום לו להרגיש בנוח ולהדגיש בפניו כי מדובר בתקלה שיש לה פתרון. להלן אוסף רב של עמודי 404 לדוגמא לצורך ההשראה…
Hard 404 vs. Soft 404
אז הגולש הוא רק צד אחד של המטבע בכל הסיפור הזה. נדבר קצת על מנועי חיפוש.
ישנם 2 סוגי קוד שגיאה 404 – “רך” ו”קשיח”. למעשה ההבדל מתבטא בסוג הסטטוס המוחזר בעת הנסיון להגיע לעמוד שאינו קיים. בסוג הקשיח (hard) מוחזר קוד 404 עבור דף לא קיים והגולש מועבר לעמוד שגיאה ייעודי, ואילו בסוג הרך (soft) מוחזר קוד 200 ok (שאומר כי הדף תקין) והגולש מועבר לרוב לעמוד הבית, לעמוד שגיאה או במקרה הגרוע יותר – נשאר באותו העמוד.
החזרת קוד 200 ok במקרה בו העמוד לא קיים בעייתי ויכול ליצור נזק, מדוע?
בד”כ אם ישנה בעיה כלשהי בעמוד, יש צורך להחזיר קוד שגיאה תקני מתאים כגון: 404 (not found) או 403 (forbidden) וכו’. אם מוחזר קוד 200 ok, הרי זה בעצם אומר שאין שום בעיה בדף, למרות שיש. אך בגלל שמנוע החיפוש נתקל בהודעת אישור, הוא עשוי לחשוב שמדובר בעמוד רגיל לכל דבר ולאנדקס אותו.
להלן ההרגשה הלא נעימה שכל אחד מהצדדים חווה כתוצאה משגיאה זו:
- הגולש – מנסה להגיע לעמוד X (בין אם באמצעות הקלדה ישירה של הכתובת ובין אם הקלקה על קישור שבור), אך בסופו של דבר הוא מגיע לעמוד Y ולא מבין למה.
- מנוע החיפוש – מנסה לזחול עמוד X, אך לבסוף מגיע לתוכן של עמוד Y (בדרך כלל עמוד הבית) ומאנדקס URL שאינו קיים. נוצר מצב של שכפול תוכן בו מתווספת לאינדקס גרסת תוכן זהה עבור 2 כתובות URL שונות.
עמודים לרשומים בלבד
מקרה פרטי נוסף של “שגיאת 404 רכה”, הינו עמוד תוכן שבו ניתן לצפות רק כאשר מחוברים לאתר באמצעות שם משתמש וסיסמא. לעיתים תמצאו ברשת קישורים שמפנים לעמודים מהסוג הזה וכאשר מגיעים אליהם, אנו מופנים לעמוד הרשמה שדורש מאיתנו להירשם בכדי לצפות בתוכן הרצוי. הבעיה היא שאותו העמוד שאליו הופנינו מחזיר קוד 200 ok. מכיוון שהזחלן בסופו של דבר ראה הודעת אישור 200 ok מכל התהליך, הוא עשוי להתייחס לעמוד הראשוני (זה שלא ניתן היה להגיע אליו בלי להירשם) בתור עמוד רגיל ולאנדקס אותו.
להלן תרשים שמתאר את התהליך:
גוגל ממליץ בפירוש להימנע מסוג השגיאות “הרך” משום שהן יוצרות הטעייה הן עבור המשתמשים והן עבור מנועי החיפוש. כתוצאה מהעיקוב בו נתקל הזחלן ושכפול התוכן שנוצר, תדירות הביקורים באתר עשויה לפחות וייתכן כי כמות נכבדה של ה-URLים שתוסיפו לאתר בהמשך, תתאנדקס לאט יותר (או במקרה הגרוע – לא יתאנדקסו כלל).
בעל אתר הוא לא תמיד וובמסטר מבריק
בואו נודה שרובנו המוחלט לא חושב על דברים מהסוג הזה. שגיאת 404 רכה, שגיאת 404 קשיחה, למי אכפת? למה שתענשו על דקויות, רק בגלל שמישהו אי שם ברשת החליט לקשר לדף באתר שלכם עם כתובת לא נכונה? אכן עדיין מעט מציק שמצופה מכם בתור מנהלי האתר לפתור את הבעיה. אז ראשית כל הסירו דאגה מליבכם – לבעיה שתיארתי ניתן משקל מינורי מאד עד לכדי אפסי בתהליך הדירוג. בדיוק מהסיבה שקשה מאד לפקח על כך ולא כל אחד יודע.
אז בדיוק מהסיבה הזאת, ובגלל ששגיאות מהסוג הזה אחראיות לכ-25% מכלל “הקישורים המתים” ברשת, ביאהו כנראה החליטו להרים את הכפפה ופיתחו פטנט, שיאפשר לזחלנים שלהם לזהות שגיאות 404 רכות. האלגוריתם המוזכר בפטנט, מתיימר לזהות דפוסים דומים בין דפי שגיאות באתרים, וע”י אבחון מאפיין משותף ניתן יהיה לזהות “similarity classes” בין ה-URLים שלהם. בנוסף ניתן יהיה לזהות את הקלאסים הבאים: Out of stock, Program exception, Login required ועוד.
בכל מקרה, למרות שגוגל עדיין לא תמיד יודע לאבחן את המקרים הללו בניגוד ליאהו, מומלץ לפתור את הבעיה בדרך המסורתית: ע”י יצירת דף נחיתה ייעודי לגולש והחזרת קוד שגיאה 404 מתאים. כאשר מוחזר קוד שגיאה תקני והגולש מופנה לדף נחיתה מועיל שמסביר את הטעות ומציע אלטרנטיבות – כולם יוצאים מרוצים 🙂