ניו-טק מגזין | מאי 2026 | המהדורה הדיגיטלית
, קרוב למקור הנתונים. הסיבה Edge ציוד אינה רק ביצועים. מדובר גם בפרטיות, ולעיתים פשוט latency עלויות תקשורת, בצורך לעבוד גם כשהרשת לא זמינה. זה כבר מזמן לא רק שקפים בכנסים ופוסטים בלינקדאין. החברות הגדולות מרגישות את זה בתפעול היומיומי שלהן. גם בצד הטכנולוגי רואים את השינוי בצורה ברורה. חלק גדול מהתעשייה עובד כיום על דרכים לקחת מודלים גדולים ולהקטין אותם בלי לאבד יותר מדי ביצועים. אחת השיטות , כלומר מעבר Quantization המרכזיות היא לחישובים מדויקים פחות מבחינה מספרית כדי לחסוך זיכרון וצריכת חשמל. במקום , מודלים רבים רצים היום ב־ FP 32 לעבוד ב־ . INT 4 ולעיתים אפילו ב־ INT 8 טכניקה נוספת שהפכה נפוצה מאוד היא . הרעיון פשוט Knowledge Distillation יחסית: מודל קטן “לומד” ממודל גדול וחזק יותר ומנסה לשמר חלק מהיכולות שלו, אבל בהרבה פחות משאבי מחשוב. השילוב בין הטכניקות הללו לבין חומרת חדשה מאפשר כיום להריץ inference גדולים, GPU מודלים שבעבר דרשו שרתי , מצלמות חכמות Edge ישירות על מחשבי ואפילו טלפונים. גם עולם השבבים משתנה בהתאם. בשנים האחרונות כל תשומת הלב הייתה סביב עצומים לאימון מודלים, אבל כעת GPUs חלק גדול מהמאמץ עובר דווקא לכיוון יעיל וחסכוני יותר. יצרניות שבבים inference NPUs ייעודיים, AI משקיעות כיום במעבדי שמיועדים לפעול בהספקים inference ומנועי נמוכים יותר. Qualcomm , NVIDIA , AMD חברות כמו כבר ממקדות חלק משמעותי Intel ו־ Hailo . גם Edge AI מהפיתוחים שלהן ב־ הישראלית הפכה בשנים האחרונות לאחת השחקניות הבולטות בתחום, בעיקר בזכות שתוכננו מראש להרצה מקומית AI מעבדי ולצריכת הספק נמוכה יחסית. , שוק שבבי ה־ IDTechEx לפי דוח של 80 צפוי לעבור את רף Edge ליישומי AI , כאשר חלק 2036 מיליארד הדולר עד משמעותי מהצמיחה צפוי להגיע מתחומי הרכב, הרובוטיקה והמכשירים החכמים. אבל אולי הסיבה המרכזית לשינוי אינה חומרה, אלא פשוט התפכחות. אחרי שנתיים של הייפ סביב מודלים כלליים שעושים “הכול”, יותר ויותר ארגונים מגלים שבפועל הם צריכים משהו הרבה
יותר ממוקד. מערכת שמנטרת פס ייצור אינה צריכה לנהל שיחה פילוסופית. רובוט תעשייתי לא חייב להבין היסטוריה או לכתוב קוד. גם מערכת רפואית בדרך כלל צריכה לבצע מספר מוגבל מאוד של משימות, אבל לעשות אותן במהירות, בעקביות וברמת אמינות גבוהה. במקרים כאלה, מודל קטן וממוקד יכול להיות פתרון טוב בהרבה ממודל עצום ויקר לתפעול. מתחיל AI זו כנראה הסיבה שהשיח סביב להשתנות. פחות דגש על ”מי בנה את המודל הגדול בעולם“, ויותר שאלות פרקטיות על , צריכת אנרגיה inference , עלויות latency קרוב למקור הנתונים. AI ויכולת להריץ יכול מאוד להיות שהשלב הבא של מהפכת לא יתרחש דווקא בדאטה סנטרים AI ה־ עצומים. ייתכן שהוא יקרה בתוך מצלמות, בקרים תעשייתיים, רובוטים, ציוד רפואי שפועלות הרחק מחוות Edge ומערכות . AI השרתים הענקיות של עולם ה־ מקורות וקרדיטים ■ MarketsandMarkets — Small Language Model Market Report , 2025–2032 Forecast ■ Dell Technologies - Edge AI Predictions for 2026 ■ IDTechEx - AI Chips for Edge Applications Report ■ N - iX Research - Edge AI Trends & Industrial AI Research 2026 ■ TechRadar Pro - Analysis on Domain Specific AI Models and Enterprise ROI ■ arXiv - ” Are Large Language Models Economically Viable for Industry Deployment ?“ (2026) מידע ונתונים נוספים מתוך פרסומים ■ Google , Meta , Microsoft טכנולוגיים של , . Qualcomm ו־ NVIDIA
Military & Aviation Exhibition 2026 הכנס המוביל בישראל לפיתוח יכולות צבאיות, תעופתיות והגנה מפני טילים
Save The Date 13.10.2026
, אקספו, תל אביב 10 ביתן 08:30-15:30 | 13.10.2026
For submitting a callout for lectures: Tomer@new–techmagazine.com
לפרטים נוספים: www.new-techevents.com ההשתתפות בכנס ובתערוכה היא למנהלים, אנשי פיתוח הנדסה ורכש, מנהלי תפעול וייצור ומנהלי בתעשיות פרויקטים במפעלים ובחברות השונות , אנשי צבא, השירותים המיוחדים ועוד הבטחוניות הכניסה למבקרים היא ללא תשלום אך נדרשת ● הרשמה מוקדמת ואישור החברה המארגנת. For more information and registration: www.new-techevents.com
25 l New-Tech Magazine
Made with FlippingBook Annual report maker