מדובר על אחד הפיתוחים המתקדמים שגוגל הוציאה עד היום, ויש סיכוי די גבוה שתהיה לו השפעה נרחבת על הדרך שבה אנחנו מחפשים או מוצאים מידע ברשת. לאחר השקת Bard מיד לאחר יציאת ה-ChatGPT, בחברה עובדים ללא הרף על פתרונות חדשים מבוססי בינה מלאכותית שעתידים לשנות את הדרך שבה כולנו עובדים. בואו נראה את ג’מיני בפעולה:
מה זה ג’מיני (Gemeni) ומה כל כך מיוחד בו?
ג’מיני הוא מודל שפה שפיתחה גוגל, והוא הוצג לראשונה בדצמבר 2022. מדובר על מודל הבינה המלאכותית הגדול ביותר שגוגל פיתחה עד היום. מה שמיוחד במודל הזה, הוא העובדה שבניגוד ל-ChatGPT או למודלים אחרים של בינה מלאכותית, המודל הזה נבנה בשיטת מולטימודל (Multimodal) – מילה שעבור הרבה מאיתנו לא אומרת דבר, אך הכוונה בפשטות היא למכונה שמבינה את העולם כמו שבני אדם מבינים אותו; באמצעות כל החושים, או אם תרצו – כל המדיות: תמונה, טקסט וקול. בעיקרון, ChatGPT כבר השיקו אופציה דומה שמאפשרת לתקשר עם הצ’אט באמצעות תמונות או אודיו.
מה ששונה בכל זאת בג’מיני, הוא שהעיבוד של כל המדיות נעשה בשכבה תחתונה יותר. כלומר, אין צורך לבצע מעבר מטקסט לקול ולאחר מכן מקול לטקסט (או מתמונה לטקסט) אלא העיבוד יתבצע ברמה עמוקה יותר. זה אומר שהמערכת “מבינה” תמונות, קבצי אודיו ואת הקשרים האסוציאטיביים ביניהן.
כשאנחנו מתכתבים עם צ’אט, אין שום בעיה שהמעבר הזה יתבצע מאחורי הקלעים, אך כשמדובר על כמויות ענקיות של מידע כמו שמחזיקה חברת גוגל – לאלגוריתם מסוג כזה יכולה להיות השפעה נרחבת על הדרך שבה המידע יאורגן מאחורי הקלעים, והצורה שבה זה יתורגם למשתמשי הקצה – אנחנו.
הנה סרטון קצר מטעם גוגל שממחיש כיצד זה עובד:
על פי גוגל:
“ג’מיני הוא תוצאה של מאמצי שיתוף פעולה רחבי היקף של צוותים ברחבי גוגל, כולל עמיתינו ב-Google Research. הוא נבנה מהיסוד כדי להיות רב-מודאלי, מה שאומר שהוא יכול להכליל ולהבין בצורה חלקה, לפעול על פני ולשלב סוגים שונים של מידע כולל טקסט, קוד, אודיו, תמונה ווידאו.”
עמד במבחן היעילות: יכולות חזקות יותר מ-Chat GPT-4
בגוגל נערכו בדיקות קפדניות כדי להשוות אותו לדגם ה-GPT-4 והעריכו את הביצועים של שניהם במגוון רחב של משימות – החל מהבנת תמונה טבעית, אודיו ווידאו ועד חשיבה מתמטית.
התוצאות: על פי גוגל, המודל קיבל ציון של 90%. הביצועים של Gemini בגרסת Ultra עולים על התוצאות העדכניות ביותר ב-30 מתוך 32 תבחינים מקובלים כשבודקים מערכות של מודל שפה גדולה (LLM).
למודל יש 3 גרסאות: Ultra, Pro ו-Nano – מה שהופך אותו למודל גמיש במיוחד שיכול להתאים למגוון סוגי מכשירים.
איך ג’מיני משתלב בחיפושי גוגל?
החל מיום ההשקה, גוגל הכריזו שבבארד תשולב גרסה מעודנת (Fined-Tuned) של Gemini בגרסת ה-Pro. הגרסה תשמש למשימות חשיבה מתקדמות יותר ומורכבות יותר. בחודשים הקרובים, גוגל הודיעה שג’מיני יהיה זמין במוצרים ושירותים נוספים של החברה כמו החיפוש בגוגל, במודעות גוגל, בגוגל כרום ו-Duet AI.
ואיך זה משתלב עם ה-SGE? מי שעקב אחרי ההתפתחויות, כבר ודאי יודע שה-SGE הוא לא רק טקסט, אלא מודל שמכיל מגוון רחב של מדיות ואפשרויות. כולן נועדו כדי לתת למשתמש את המענה הכי רלוונטי לשאילתת החיפוש. לטענת גוגל, ג’מיני הוא מה שהופך את SGE למודל מהיר אפילו יותר. בעזרת שילוב של המודל החדש, הצליחו להשיג הפחתה של 40% בזמן התגובה שלו.
בסופו של דבר, ה-SGE מתוכנן להשתלב בחיפושי גוגל באופן טבעי. כשזה יקרה, אנחנו עשויים להגיע לעידן שבו נשאל את עצמנו: איך הצלחנו לחפש אחרת בעבר?