קפיצת מדרגה משמעותית בתחום הבינה המלאכותית - OpenAI חשפה את הדגם האחרון שלה, GPT-4o, המבטיח לחולל מהפכה באופן שבו בני אדם מתקשרים עם AI. מודל מתקדם זה, נחשב כצעד אחד קרוב יותר לאינטראקציה טבעית בין אדם למחשב, ומתגאה במגוון יכולות שהיו פעם חומר לסרטי מדע בדיוני. מהבנה ויצירת טקסט, אודיו ותמונות ועד לזיהוי רגשות ותגובה כמעט מיידית, GPT-4o קובע סטנדרט חדש לתקשורת בינה מלאכותית.
התכונה הבולטת של GPT-4o היא היכולת הרב-מודאלית שלו (סוג מתקדם של בינה מלאכותית שמאפשר להבין ולעבד מידע משיטות שונות, כגון טקסט, אודיו, תמונה ווידאו). שלא כמו קודמיו, GPT-4o יכול לעבד וליצור בצורה חלקה פלטים בפורמטים של טקסט, אודיו וחזותי. גישת "אומני" זו, כפי שמסומנת ב-"o" של GPT-4o, משנה את חוקי המשחק. זה אומר שמשתמשים יכולים לקיים אינטראקציה עם AI בצורה טבעית ואינטואיטיבית יותר, תוך שימוש בכל שילוב של קלט. בין אם מדובר בהקלדת שאלה, דיבור אל AI או הצגת תמונה, GPT-4o יכול להבין ולהגיב כראוי, מה שגורם לאינטראקציה להרגיש אנושית יותר.
קרדיט: יוטיוב OpenAI
יכולות GPT-4o
במהלך מצגת בשידור חי, Mira Murati - המשמשת בתפקיד CTO של OpenAI החברה המפתחת של ChatGPT - הציגה את הרבגוניות של GPT-4o. המודל נראה מתרגם בלייב בין אנגלית לאיטלקית, פותר משוואות מורכבות בזמן אמת על ידי פירוש הערות בכתב יד, ואפילו מתן הנחיית נשימה על ידי הקשבה לנשימות המשתמש. הדגמות אלו הדגישו לא רק את היכולות הטכניות של GPT-4o אלא גם את הפוטנציאל שלו לסייע במגוון רחב של יישומים בעולם האמיתי, מחינוך ועד שירותי בריאות.
מוראטי הדגישה את הדמוקרטיזציה של הטכנולוגיה המתקדמת הזו על ידי הפיכתה לנגישה למשתמשים בחינם. "הדבר המיוחד ב-GPT-4o הוא שהוא מאפשר אינטליגנציה ברמת GPT-4 לכולם, כולל המשתמשים החינמיים שלנו", אמרה. מהלך זה אמור להפוך כלי AI מתוחכמים לזמינים לקהל רחב יותר, מה שעשוי לשנות את אופן ביצוע המשימות היומיומיות.
מהירות ואינטליגנציה רגשית
אחד השיפורים הקריטיים ב-GPT-4o הוא היכולת שלו לזהות ולהגיב לרמזים רגשיים. דגמים קודמים, כמו GPT-3.5 ו-GPT-4, יכלו להתמודד עם קלט קולי, אך עשו זאת על ידי המרת דיבור לטקסט, ואיבדו ניואנסים רגשיים בתהליך. עם זאת, GPT-4o שומר על הטון וההקשר הרגשי של הדובר, ומאפשר אינטראקציות אמפטיות ומרתקות יותר. בנוסף, זמן התגובה של הדגם שופר משמעותית, מה שמאפשר לו לעמוד בקצב של השיחה האנושית הטבעית, שהוא חיוני לחוויית משתמש חלקה.
השקת יישום שולחן העבודה
במקביל לשחרור של GPT-4o, השקה נוספת של OpenAI הינו יישום שולחן עבודה עבור ChatGPT. מהלך זה נועד לספק פלטפורמה משולבת וידידותית יותר לגישה ליכולות AI. משתמשים בתשלום יכולים להתחיל להשתמש באפליקציית שולחן עבודה באופן מיידי, כאשר בקרוב צפויה השקה למשתמשים בחינם. פיתוח זה מדגיש את המחויבות של OpenAI לשפר את הנגישות והנוחות עבור משתמשיה.
נוף תחרותי
ההכרזה של OpenAI על GPT-4o מגיעה בזמן מעניין מבחינה אסטרטגית, יום אחד בלבד לפני Google I/O, כנס המפתחים השנתי של גוגל. במה שנראה כהתקפת מנע, גוגל השיקה גרסה חדשה של צ'אטבוט AI שלה, Gemini, עם יכולות דומות. הדבר מצביע על תחרות מתפתחת בתחום הבינה המלאכותית, כאשר ענקיות הטכנולוגיה דוהרות קדימה, ומנסות להתעלות זו על זו במתן פתרונות בינה מלאכותית מתקדמים וידידותיים יותר למשתמש.
GPT-4o מהווה צעד גדול קדימה בטכנולוגיית הבינה המלאכותית, המשלב תשומות מולטי-מודאליות עם היענות כמעט אנושית ואינטליגנציה רגשית. על ידי הפיכת הכלי החזק הזה לזמין לכל המשתמשים, OpenAI לא רק פורצת את הגבולות של מה שבינה מלאכותית יכולה לעשות אלא גם מבטיחה שההתקדמות תהיה נגישה לקהל רחב יותר. היכולות של GPT-4o מציעות הצצה לעתיד שבו אינטראקציה בין אדם למחשב היא טבעית ואינטואיטיבית כמו שיחה עם אדם אחר.
גילו נאות: באיתור התוכן לכתיבת המאמר בוצע שימוש בכלי הבינה המלאכותית ChatGPT בגרסתו החדשה "GPT-4o".
רוצים להשאר מעודכנים בכל החדשות מעולמות הדיגיטל, הטכנולוגיה והשיווק?
השאירו את פרטיכם כאן! מבטיחים לא לאכול את הראש
*אם יש לכם הערה, טענה או מענה לגבי המאמר שקראתם כעת, אתם מוזמנים ליצור איתנו קשר
שניים מחברי הביטלס כבר אינם בין החיים, ומאז התפרקה הלהקה חלפו 53 שנים, אך באמצעות טכנולוגיית בינה מלאכותית יצר ערוץ יוטיוב פרטי ביצוע מחודש לשיר "New" של פול מקרטני (במידה וזה אכן הוא) המשלב ומאחד בתוכו את קולותיהם של כלל חברי הלהקה המקורית והמיתולוגית.
עד כה, הבעיה העיקרית (ויש אף כאלו שיאמרו היחידה) של השירות "ChatGPT" הייתה טמונה בכך, כי המידע עליו הוא מתבסס עדכני רק עד לשנת 2021, ולא מעבר. כמצוין בדף הבית של ChatGPT, הדבר עשוי להוביל לעיתים לקבלת תשובות שגויות או שאינן מדויקות, ולמצבים בהם לשירות פשוט אין את המידע הדרוש כדי לספק תשובה לשאילתא.
בימים האחרונים פרסמה חברת OpenAI כי בעיה זו עתידה סוף סוף להיפתר וכי השירות יחל להתבסס ולפעול על פי מודל השפה GPT-4, בדומה לזה הקיים ב-"The New Bing", הדפדפן החדש מבית מיקרוסופט אותו פיתחו השתיים בצוותא.
בחודשים האחרונים מי מבינינו שמשתמש באינסטגרם צופה (נכון לומר - נאלץ לצפות) בעלייה חדה בכמות של פרסומי סטורי ספציפיים. לא, אני לא מדבר על הסרטונים של הקאוצ'רים שבדיוק סיימו משמרת בבורגראנץ' והתפנו ללמד אותנו איך להרוויח מיליונים.
אני מדבר על תמונות, ודיוקנים עצמיים שנוצרו על ידי יישומי בינה מלאכותית (AI - Artificial Intalagence), כדוגמת - Dall-E ו Mindjourney, והפכו לנחלת הכלל. יישומי בינה מלאכותית אלה מהווים את הדבר הבא ששוטף את כל הרשתות החברתיות, וללא ספק מובילים למהפכה בתחום, והופכים את הבינה המלאכותית לנגישה וידידותית גם לאלו שלא הכירו אותה או חששו מהשימוש בה.
השקת דפדפן הבינה המלאכותית החדש של מיקרוסופט (The New Bing) בסוף חודש פברואר האחרון תפסה את גוגל עם המכנסיים למטה, והציבה אותה בעמדת נחיתות אשר הייתה כמעט זרה לה.
בשל הפיגור המשמעותי בו ניצבה גוגל החלה לזרז את תהליך הפיתוח של Bard, צ'אטבוט הבינה המלאכותית המתחרה שלה, ומהירה להשיק את גרסת הבטא שלו בסוף חודש אפריל האחרון על אף הכשלים המהותיים אשר היו קיימים בו ויכולותיו הלא מרשימות בלשון המעטה בהשוואה לשאר המתחרים בשוק. כעת, כחודשיים וחצי לאחר השקתו הראשונית הפך השירות לזמין גם בשפה העברית, ואנו בחנו אותו עבורכם ושרדנו כדי לספר.