ניו-טק מגזין | מאי 2026 | המהדורה הדיגיטלית
מערכת ניו-טק מגזינים גרופ » AI לא מספיקים יותר: המרוץ החדש על חומרת ה־ GPUs
נראים אחרת לגמרי מאימון מודלים. מערכות ראייה ממוחשבת במפעלים, רובוטים ברכב או מכשור ADAS אוטונומיים, מערכות רפואי מתקדם אינם צריכים בהכרח מפלצות שמחוברות לדאטה סנטר. הם צריכים GPU נמוך, צריכת הספק latency תגובה מהירה, סבירה ויכולת לעבוד בצורה יציבה גם כאשר החיבור לענן מוגבל או לא קיים בכלל. תוכננו במקור GPU הבעיה היא שמעבדי לעולם אחר. מעבדים גרפיים מצטיינים בעיבוד מקבילי רחב היקף, וזו אחת הסיבות המרכזיות לכך קדימה. אבל AI שהם הזניקו את עולם ה־ Edge AI ככל שהתעשייה דוחפת לכיוון של ייעודיות, מתברר של־ inference ומערכות יש תג מחיר כבד מאוד, פשוטו כמשמעו. GPU מודרניים מגיעים כיום להספקים AI מאיצי ואף יותר לכרטיס בודד. כאשר 700 W של מחברים עשרות ומאות כאלה יחד בארונות שרתים, צריכת החשמל והקירור הופכות לאתגר הנדסי משמעותי בפני עצמו. הבעיה החדשה: צריכת חשמל וזיכרון
במשך רוב תקופת הבום של הבינה המלאכותית, נדמה היה שהתשובה לכל שאלה טכנולוגית היא פשוט להוסיף עוד תפחו לממדים AI ה־ . ככל שמודלי GPU AI עצומים, כך גם הביקוש למעבדי עתירי ביצועים שבר שיאים. חברות טכנולוגיה רכשו אלפי מאיצים גרפיים, דאטה סנטרים חדשים נבנו בקצב חסר הפכה בתוך זמן קצר NVIDIA ו־ תקדים, לאחת החברות המשפיעות ביותר בתעשיית הטכנולוגיה. מתחיל להסתמן שינוי 2026 בל ב־ א מגלה AI כיוון ברור. תעשיית ה־ לבדו כבר אינו פתרון קסם, GPU בהדרגה ש־ ובחלק מהמקרים הוא אפילו הופך למגבלה. ככל שהטכנולוגיה יוצאת מחוות השרתים ועוברת למערכות שצריכות לעבוד בעולם האמיתי, הדרישות משתנות לחלוטין. השאלה כבר אינה כמה כוח מחשוב אפשר לדחוף למודל בזמן האימון, אלא כמה מהר, יעיל וזול ניתן להריץ אותו לאורך זמן. ופה בדיוק מתחיל המרוץ החדש של עולם החומרה.
עידן האימון מפנה מקום Inference לעידן ה- Generative בשנים הראשונות של מהפכת ה־ , עיקר תשומת הלב הופנה לשלב האימון. AI חברות התחרו ביניהן על גודל המודל, מספר שנדרשו כדי GPUs הפרמטרים וכמות ה־ להחזיק תהליכי אימון שנמשכו שבועות ולעיתים חודשים. אלא שכיום מרכז הכובד מתחיל לעבור , כלומר שלב Inference בבירור לעולם ה־ ההרצה בפועל של המודל מול משתמשי קצה ומערכות אמיתיות. בפועל, רוב העלויות ארוכות הטווח של אינן נובעות מאימון חד פעמי, AI מערכות אלא מההרצה היומיומית שלהן. ככל שמספר המשתמשים גדל וככל שיותר מערכות בזמן אמת, כך inference מתחילות להפעיל גדל גם העומס על התשתיות. , Gartner לפי הערכות שפורסמו השנה על ידי החדשים AI חלק משמעותי מעומסי ה־ בשנים הקרובות צפוי להגיע דווקא מיישומי מבוזרים ולא רק ממודלי ענן inference מרכזיים. inference זו נקודה קריטית, משום שיישומי
New-Tech Magazine l 30
Made with FlippingBook Annual report maker