ניו-טק מגזין | מאי 2026 | המהדורה הדיגיטלית
קטן, מהיר וחסכוני: המרוץ החדש של תעשיית הבינה המלאכותית
מערכת ניו-טק מגזינים גרופ »
מאחורי התחזית הזו מסתתר שינוי עמוק יותר. ארגונים מתחילים להבין שלא תמיד צריך את “המודל הכי חזק בעולם”. לפעמים עדיף מודל קטן יותר, שמכיר היטב תחום ספציפי ועולה הרבה פחות להרצה ותחזוקה. המעבר הזה קשור גם לשינוי אחר שמתחיל . אם לפני שנתיים כל AI לעבור על עולם ה־ הדיון עסק באימון מודלים, היום השיחה . כלומר, Inference עוברת בהדרגה לעולם ה־ לא רק איך מאמנים מודל, אלא איך מריצים אותו בעולם האמיתי. וזה כבר סיפור הרבה יותר מורכב. מערכת רובוטית בקו ייצור לא יכולה להמתין שנייה או שתיים לתשובה מהענן. מצלמת בטיחות חכמה לא יכולה להיות תלויה תמיד בחיבור רשת יציב. גם ציוד רפואי או מערכות רכב אוטונומיות צריכים לקבל החלטות בזמן אמת, לעיתים בתוך מילישניות בודדות. כאן בדיוק מתחילה הבעיה של מודלי הענק. הם אמנם מרשימים מאוד ביכולות שלהם, אבל בעולם הפיזי הם דורשים משאבי מחשוב, צריכת הספק ורוחב פס שלא תמיד אפשר לספק. Dell שפרסמה השנה Edge AI לפי דוח , יותר חברות עוברות למודלים Technologies קטנים וממוקדים שיכולים לפעול ישירות על
בענן. במקרים רבים, השאלה החשובה באמת היא בכלל אחרת: כמה מהר המערכת מגיבה, כמה חשמל היא צורכת, כמה עולה להריץ אותה והאם היא יכולה לעבוד גם בלי חיבור קבוע לדאטה סנטר מרוחק. זו בדיוק הסיבה שבשנה האחרונה המושג , מופיע SLMs , או Small Language Models . AI כמעט בכל דוח תעשייה גדול שעוסק ב־ גם חברות הענק שהובילו את מרוץ המודלים הגדולים כבר משקיעות עכשיו מאמצים הרחיבה את Meta משמעותיים בכיוון הזה. עם גרסאות קטנות ויעילות Llama משפחת יותר, כולל מודלים שמיועדים לפעול על דוחפת Edge Google תחנות עבודה ומערכות Gemini Nano ואת Gemma את משפחת שמיועד להרצה ישירה על סמארטפונים נכנסה חזק Microsoft ומכשירי קצה. גם , שמנסים לספק יחס Phi לתחום עם מודלי טוב יותר בין ביצועים לדרישות חומרה. עצם העובדה שהחברות שהובילו את עידן מודלי הענק הן גם אלה שמקדמות עכשיו מודלים קטנים יותר, מספרת לא מעט על הכיוון שאליו השוק הולך. , שוק Marketsand Markets לפי דוח של מיליון דולר 930 צפוי לצמוח מכ־ SLMs ה־ . אבל 2032 מיליארד דולר עד 5.45 לכ־ 2025 ב־
במשך כמעט שלוש שנים נדמה היה שתעשיית הבינה המלאכותית מתקדמת בכיוון אחד בלבד. כל דור חדש של מודלים היה גדול יותר, כבד יותר ודרש יותר כוח מחשוב מקודמו. מספר הפרמטרים הפך למדד המרכזי שלפיו נמדדה ההתקדמות, וחברות הטכנולוגיה הגדולות נכנסו למרוץ חימוש של ממש סביב בניית מודלים עצומים והקמת תשתיות מחשוב בקנה מידה חסר תקדים. לא שבחודשים האחרונים מתחיל א להסתמן שינוי מעניין הרבה יותר. דווקא בזמן שחברות משקיעות מיליארדים ובמרכזי נתונים חדשים, יותר GPU בחוות ויותר ארגונים מגלים שבמערכות אמיתיות, אלה שפועלות במפעלים, ברובוטים, במצלמות, בציוד רפואי או ברכב, מודלים קטנים ויעילים מספקים לעיתים תוצאה טובה יותר ממודלי הענק. זה לא אומר שעידן המודלים הגדולים הסתיים. רחוק מזה. אבל נראה שהתעשייה דורשת AI מתחילה להבין שלא כל משימת מודל של מאות מיליארדי פרמטרים שרץ
New-Tech Magazine l 24
Made with FlippingBook Annual report maker