לאחרונה פנו אלי מספר רב של בעלי אתרים בארץ עם אותה השאלה – מדוע לדעתי האתרים שלהם נענשו? הגורם המשותף לכל אותם האנשים היה – הדומיין בעברית. למרות שבעבר כתבתי על כך שאני לא ממליץ להקים אתר על דומיין בעברית, נראה כי עד לאחרונה הם הצליחו במבחן התוצאה (אני עדיין לא ממליץ להשתמש בהם משיקולים נוספים מלבד SEO). אז מה קרה לאחרונה? בדיוק בכדי לענות על השאלה הזו, לפניכם פוסט אורח מרתק שגבריאל הנר שלח לי בנושא.
לפני כשבועיים הבחנו שהאתרים עם שם דומיין בעברית מסולקים מדף ראשון, ולכן, בישיבת צוות של נירמי, הוטל עלי לערוך מחקר מקיף בנושא, מאחר ויש לי נטייה לחפור.
תחילה אבקש להבהיר מהם שמות דומיין בעברית. לא בגלל שאינכם יודעים, אלא משום שקיימות הרבה אי בהירויות בנושא ומרבית העוסקים בקידום אתרים ניזונים בעיקר משמועות.
היכן הכל התחיל ואיפה מתחילות הבעיות?
ובכן, בנובמבר 2009, הכריז איגוד האינטרנט העולמי ICANN (ראשית תיבות של Internet Corporation for Assigned Names and Numbers) על הניסוי ברישום שמות מתחם ב-11 שפות שאינן אנגלית.
- ערבית
- סינית מדוברת
- סינית קלאסית
- יוונית
- הודית
- יפנית
- קוראנית
- פרסית
- רוסית
- טמילית
- ויידיש
בהמשך הוספו 6 שפות נוספות, ביניהן גם עברית. ההכרזה פורסמה לאחר יותר משנה של ניסויים אשר בוצעו על ידי מחלקת בלשנות מיוחדת ב-ICANN בראשות Tina DAM.
ראה את סרטון ההכרזה על שמות המתחם הבינלאומיים ב-CNN:
Tina Dam, מנהלת תחום שמות המתחם הבינלאומיים, (או IDN) ב-ICANN מזה כשנה, הגיעה אל משרדי ICANN מדנמרק, לפני 4 שנים.
למרות ששמות המתחם במספר שפות נראה לנו כעת טבעי ואינטואיטיבי, לא כך היה בתחילת המחקר ועד היום מתלבטים החוקרים בבעיות רבות המתעוררות מהעובדה שמעורבים בשמות המתחם הבינלאומיים סימנים במספר שפות.
לדוגמה: כיצד ייראה מייל שישלח מתוך שם מתחם בינלאומי:
info.השכרתרכב@info
או-
info@xn--5dbfva8daek.com
דוגמה נוספת: כאשר רושמים את שם המתחם בעברית עם סיומת קום, האם word יזהה שזהו שם מתחם ויהפוך אותו אוטומטית ל-clickable (אגב, רק בשנים האחרונות החלה מיקרוסופט לתכנת את גרסאות word כך ששמות מתחם בשפות שונות יהפכו ל-clickable אוטומטית).
עוד ביקשו החוקרים לגלות כיצד יגיבו שמות המתחם הבינלאומיים תחת דפדפנים שונים, בתוך אתרי אינטרנט שונים וכיצד ידעו הגולשים שסדרת האותיות והמספרים המסתתרים מאחורי שמות המתחם הבינלאומיים, אכן בשפתם ולא בשפה אחרת. לא אלאה אתכם במושגים מהתחום (Unicode, Punicode, Stringprep).
נניח שאני מבקש לקשר אל הדומיין com.השכרתרכב האם עלי לקשר אל:
http://www.השכרתרכב.com
או שעלי לקשר אל:
http://www.xn--5dbfva8daek.com
או אפשרות שלישית:
http://www.%d7%94%d7%a9%d7%9b%d7%a8%d7%aa+%d7%a8%d7%9b%d7%91.com
למעשה, מספר השאלות כה רב, והן כה סבוכות שהחוקרים החליטו להעביר את כל המחקר אל אתר wiki מיוחד לנושא ה-IDN בו שיתפו את כל מי שהתעניין בנושא ואפשרו לגולשים לתרום למחקר העצום.
כתובת אתר הוויקי היא: idn.icann.org, באנגלית, וכמובן שקיימת גרסה עברית לאתר. ניתן גם להגיע לאתר על ידי חיפוש בגוגל של המילה “טעסט”.
פיענוח דומיינים בינלאומיים על ידי גוגל
שאלה חשובה במחקר היא כמובן, כיצד גוגל מתייחסים לעובדה ש-ICANN מאפשרים רישום שמות מתחם בשפות שונות, ומה הם עושים למען פרויקט זה? אם ICANN הקימו wiki כדי שכל העולם יעזור להם להתמודד עם הבעיות שמעוררות השפות, ותרגום שמות המתחם לסימני אנגלית ומספרים, הרי שאצל גוגל המורכבות היא עשרת מונים יותר מסובכת.
אנסה להבהיר את הבעיה במלואה חריפותה:
אם נציג בפניכם את סדרת הסימנים “xn--5dbfva8daek.com”, כיצד תדעו באיזו שפה שם המתחם הזה?
ובכן, לא תוכלו לגלות. כל שיעלה בכחכם הוא לנחש שמדובר בשם מתחם בינלאומי, וזאת על פי 4 הסימנים הראשונים: x n – – . אין לכם מושג באיזו שפה שם המתחם הזה.
ובכל זאת, כיצד זה עובד? היכן מתורגם שם המתחם לשפה הנכונה?
אם תקליקו על “אפשרויות אינטרנט” תחת “כלים” בדפדפן Internet Explorer, תגלו שם לחצן “שפות” (או “laguages”). לחצו על “שפות” ותקבלו מסך המפרט את השפות בהן בעל המחשב מעוניין לקבל את ה-IDN שמוצגים על ידי ה-IE. זה הסוד של פיענוח הסימנים לעברית.
אבל, אם רשמתי שם מתחם “com.השכרתרכב” והתכוונתי שיוצג בעברית, אין כל וודאות שגולש עם מחשב המוגדר על ידי בעליו לקרוא בערבית או רוסית יראה את שם המתחם בעברית. ולהיפך, הוא יראה על המסך מן סוג של ג’יבריש או סדרת ריבועים.
כעת, אתם מבינים עד כמה זה מסובך לגוגל? הם צריכים לקרוא את שם המתחם בסימנים ומספרים, לתרגמו לכל השפות הנתמכות על ידי ICANN ולנסות להבין מתי צירוף הסימנים נותן תוצאה כלשהי בשפה כלשהי.
ואולם, יש להודות שאנשי גוגל עשו עבודה נפלאה, ויעיד על כך כל מי שניסה לקדם אתר בעל שם מתחם בעברית: אם מילת החיפוש אינה תחרותית מידי, האתר מזנק לעמוד ראשון בתוך מספר שבועות.
דומיינים בעברית נעלמו מגוגל
אבל, יש לציין כאמור, ששמות המתחם בעברית, בשבועיים האחרונים, נעלמו מעמוד ראשון בגוגל וכל בעלי האתרים שהסתמכו על שם דומיין בעברית ממש מודאגים.
ובכן, אומר לכם מה אני חושב על כך. כמובן שאין זו אלא דעה אישית המסתמכת על מעקב אחר התנהגות גוגל מזה מספר שנים. אחרי זמן מה, מכירים את התנהגות החיה, למרות שלא ניתן לתקשר עימה.
ראשית, לא נשמע סביר שגוגל החליטו להעניש באופן סיטוני את כל בעלי אתרי האינטרנט עם שם מתחם בעברית או בינלאומי.
שנית, com.השכרתרכב.www לא נענש ועומד על כנו בעמוד ראשון בביטוי התחרותי “השכרת רכב”. אגב, גם com.קורסקידוםאתרים.www עדיין בשורה ראשונה בביטוי זה.
שלישית, פניתי לגוגל כדי לברר עמדתם והתברר לי שהאחראי על פרויקט פיתוח ה-IDN בגוגל (שם הפרוייקט מעיד על עמדת גוגל ביחס אליו – “go-idn”) ושמו Hannson נמצא בחופשה עד ליום 15 במאי.
כעת, או שבשובו, הוא יגלה את התקלה שנוצרה וישיב את שמות הדומיין הבינלאומיים על כנם ולמלוא הדרם, או שמעתה, בעל שם דומיין בעברית יאלץ לקדם את האתר בעבודה מפרכת רגילה כמו כל בעל דומיין שלא זכה לרכוש את שם המתחם שמתאים למילות החיפוש שלו, בזמן.
דבר אחד ברור, גוגל לא הטיל עונש קולקטיבי על כל שמות הדומיין בעברית.
כותב הפוסט הוא גבריאל הנר – מנהל ושותף באתר נירמי קידום אתרים