עם הזמן. ככל הנראה, הביצועים הטובים
ביותר ליחידת הספק מגיעים מתכנון עם
(או אפילו בשערים לוגים). אבל זוהי
RTL
גם הדרך הפחות גמישה לשינויים. הדרך
הקלה ביותר להשגת גמישות בתיכנון היא
באמצעות תוכנה טהורה, והרצת הקוד
הראשי.
CPU
של הרשת העצבית על ה-
דרך זו פשוטה אך אין לה סיכוי להשיג
את הביצועים הנדרשים או את החיסכון
באנרגיה. מעבד אופייני לרשת עצבית הניתן
לתכנות הוא לא חם ולא קר. ניתן לתכנות
אך דורש ביצועים גבוהים פר וואט.
כדי להדגים את המהירות בה דברים
הייתה
AlexNet
2012
משתנים: בשנת
מערכת הזיהוי הטובה ביותר שדרשה
RESNET-152
. כיום,
724MMACS
/
image
(וכמובן, מביאה
11B
דורשת יותר מ-
תוצאות טובות יותר). מהירויות השינוי
מצביעות על הקושי הגדול שעומד בפני
האנשים שמתכננים את המוצרים כיום:
כיצד ניתן ליצור פלטפורמה מתאימה
ואולי אף
2019-
למוצר שישווק ב
2017-
ב
כמה שנים לאחר מכן. על הפלטפורמה
להכיל את שלושת המאפיינים הבאים:
ביצועים גבוהים, צריכת אנרגיה נמוכה
ויכולת היתכנות. תכנון פלטפורמה
או טכנולוגיה בעלת שניים משלושת
המאפיינים היא לא משימה קשה אך
שילוב של שלושתם, שלרוב באים אחד על
חשבון השני, היא משימה מסובכת בהרבה.
קיידנס הכריזה לאחרונה על חבר חדש
Tensilica
:
Tensilica
Vision
C
5
למשפחת
neural
לרשת עצבית (
DSP
IP
- ליבת
DSP
), הראשונה בתעשייה שהיא
network
עצמאית, מוכללת ומותאמת ליישומי
וקול - כולם בעלי
LIDAR
ראייה, מכ"מ,
דרישה לזמינות גבוהה של מחשוב רשתות
מיועד לשוקי
Vision
C5
DSP
עצביות. ה-
הרכב, המעקב, הרחפנים והמחשוב הנייד
1TMAC
והלביש, ומציע יכולת מחשוב של /
כדי להפעיל את כל משימות המחשוב
sec
של הרשת העצבית.
פלטפורמה זאת בשונה מפתרונות אחרים
הקיימים בשוק אינה מאיץ תוכנתי
העומד
DSP
) אלא מעבד
Accelerator
(
OFFLOADING
בפני עצמו היכול לבצע
.)
HOST CPU
מהמעבד המרכזי (
בשונה ממאיץ המקושר למעבד ועושה רק
יכול לבצע
Vision C5
שלבי קונבולוציה, ה-
מבלי
CNN
את כל שלבי העיבוד הנדרשים ל
«
«
TensorFlow
.1
תמונה
Vision C5 DSP
.2
תמונה
Chip Design
מוסף מיוחד
New-Tech Magazine l 78