במטא לא ממש מספרים לנו איך הכלי הזה ייכנס לאפליקציות ומהי מטרתו, אך כבר עכשיו ניתן לראות שמדובר על יכולות שונות ממה שראינו עד היום. הכירו את הכלי SeamlessM4T – בהמשך לשימוש הנרחב לאחרונה של בינה מלאכותית בחברות הטכנולוגיה, הפעם מדובר על כלי שיכול לתרגם שפות בקלות רבה הרבה יותר, ומסוגל לבצע תרגומים בזמן אמת בצורות שונות. בין יכולותיו, ניתן לתרגם בכל דרך שניתן להעלות על הדעת ובמהירות – זאת בזכות פיתוח של מודלים חדשים בחברה המבוססים על טכנולוגיית ה-AI. כך, ניתן לתרגם טקסט:
- מדיבור לדיבור
- מדיבור לטקסט
- מטקסט לטקסט
המשמעות היא שניתן לייצר תקשורת רציפה בין שני אנשים או יותר, גם אם אינם מדברים באותה השפה.
מה הקשר למטא?
המטרה הגדולה של מטא, כפי שניסחה זאת בחזונה היא: “לקרב את העולם יחדיו” (“Bringing the World Closer Together”). בדיוק כפי שפייסבוק החלה לחבר את העולם, אי שם בשנת 2004 באמצעות יצירת הרשת החברתית שלה כעת מגיע עוד שינוי מצידה, שיעזור לנוע באותו הכיוון. אחד החסמים שמקשים כיום על מדינות מרחבי העולם להתחבר, הוא חסם השפה – ואת זה מטא שואפת לפתור.
כיום, הסיבה שזה לא קרה היא שיש לנו טכנולוגיות שיודעות לתרגם אותנו כשאנחנו מדברים, אך הן יודעות לבצע זאת במספר שלבים שלוקחים זמן עיבוד רב: תחילה התוכנה צריכה להבין מה אנחנו אומרים ולייצר פלט טקסט, לאחר מכן לתרגם את הטקסט, לתרגם את הטקסט לשפה זרה ורק בשלב האחרון היא יכולה לתרגם אותו לפלט קולי ולהשמיע בשפה הסופית. תהליך מורכב זה, לוקח זמן של מספר שניות ואי אפשר לנהל תקשורת רציפה בדרך הזו.
חלק ממה שמהפכת ה-AI העניקה לנו הוא היכולת להבין שפה באופן ישיר מקול של אדם, ללא צורך בהוצאת פלט טקסט. זו הזדמנות שנקרתה בדרכה של מטא, ונראה שהיא עושה בה שימוש מועיל עבורה ועבור כולנו.
במה תומך המתרגם החדש?
לכלי התרגום החדש יש מספר תכונות מעניינות נכון לכתיבת שורות אלה, וביניהן:
- היכולת להבין יותר מ-100 שפות ישירות מדיבור.
- תרגום מדיבור לטקסט עבור כמעט 100 שפות בעולם.
- בתרגום מטקסט לדיבור – תמיכה ב-100 שפות קלט ו-36 שפות פלט.
- תרגום טקסט לטקסט עבור כמעט 100 שפות.
- תרגום מטקסט לדיבור – בכמעט 100 שפות קלט ו-35 שפות פלט.
ממטא נמסר:
“אנו מאמינים שהעבודה עליה אנו מכריזים היום היא צעד משמעותי קדימה במסע. המודל היחיד שלנו מספק תרגומים לפי דרישה, המאפשרים לאנשים הדוברים שפות שונות לתקשר בצורה יעילה יותר. אנו משפרים משמעותית את הביצועים עבור שפות המשאבים הנמוכים והבינוניים שאנו תומכים בהם. אלו שפות שיש להן טביעות רגל לשוניות דיגיטליות קטנות יותר. אנו גם שומרים על ביצועים חזקים בשפות עתירות משאבים, כגון אנגלית, ספרדית וגרמנית. SeamlessM4T מזהה באופן מרומז את שפות המקור, ללא צורך במודל זיהוי שפה נפרד.”