רשתות עצביות קונבולוציוניות (CNNs) תוכננו לראשונה למטרת זיהוי תמונה בתחום הראייה הממוחשבת. רשתות אלו הן סוג מיוחד של רשת עצבית מלאכותית שהוכחה כיעילה ביותר בניתוח נתונים חזותיים. הפיתוח של CNN הונע מהצורך ליצור מודלים שיוכלו לסווג ולסווג במדויק תמונות, והצלחתם בתחום זה הובילה לשימוש נרחב שלהם ביישומים שונים אחרים כגון זיהוי אובייקטים, פילוח תמונות ואפילו עיבוד שפה טבעית.
CNNs שואבים השראה מהמבנה והפונקציונליות של קליפת המוח החזותית במוח האנושי. כמו קליפת המוח החזותית, CNN מורכבים משכבות מרובות של נוירונים מחוברים המעבדים היבטים שונים של נתוני הקלט. החידוש העיקרי של CNNs טמון ביכולתם ללמוד ולחלץ תכונות רלוונטיות מתמונות באופן אוטומטי, ולבטל את הצורך בהנדסת תכונות ידנית. זה מושג באמצעות שימוש בשכבות קונבולוציוניות, המחילות מסננים על תמונת הקלט כדי לזהות תבניות ותכונות ויזואליות שונות, כגון קצוות, פינות ומרקמים.
פריצת הדרך הראשונה ב-CNN הגיעה עם הצגת ארכיטקטורת LeNet-5 על ידי Yann LeCun וחב'. בשנת 1998. LeNet-5 תוכנן במיוחד לזיהוי ספרות בכתב יד והשיג ביצועים יוצאי דופן במערך הנתונים של MNIST, מערך נתונים בנצ'מרק בשימוש נרחב להערכת אלגוריתמים של זיהוי תמונות. LeNet-5 הדגים את הכוח של CNN בלכידת מאפיינים היררכיים מתמונות, ואיפשר סיווג מדויק גם בנוכחות וריאציות בקנה מידה, סיבוב ותרגום.
מאז, רשתות CNN התפתחו באופן משמעותי, עם פיתוח ארכיטקטורות עמוקות ומורכבות יותר. התקדמות בולטת אחת הייתה הצגת ארכיטקטורת AlexNet על ידי Alex Krizhevsky et al. בשנת 2012. AlexNet השיגה פריצת דרך בסיווג תמונות על ידי זכייה באתגר ImageNet Large Scale Visual Recognition (ILSVRC) עם שיעור שגיאות נמוך משמעותית בהשוואה לגישות קודמות. הצלחה זו סללה את הדרך לאימוץ נרחב של CNN במשימות זיהוי תמונות.
CNNs יושמו בהצלחה גם למשימות ראייה ממוחשבת אחרות. לדוגמה, בזיהוי אובייקטים, ניתן לשלב CNNs עם שכבות נוספות כדי למקם ולסווג אובייקטים בתוך תמונה. הרשת המפורסמת המבוססת על אזורים עצביים (R-CNN) שהוצגה על ידי Ross Girshick וחב'. בשנת 2014 היא דוגמה לארכיטקטורה כזו. R-CNN השיגה תוצאות מתקדמות בנושא מדדי זיהוי אובייקטים על ידי מינוף הכוח של CNN לחילוץ תכונות ושילובה עם שיטות הצעות אזוריות.
רשתות עצביות קונבולוציוניות תוכננו לראשונה למשימות זיהוי תמונות בתחום הראייה הממוחשבת. הם חוללו מהפכה בתחום על ידי למידה אוטומטית של תכונות רלוונטיות מתמונות, ומבטלות את הצורך בהנדסת תכונות ידנית. הפיתוח של CNNs הוביל להתקדמות משמעותית בסיווג תמונות, זיהוי אובייקטים ומשימות שונות של ראייה ממוחשבת.
שאלות ותשובות אחרונות אחרות בנושא EITC/AI/ADL למידה עמוקה מתקדמת:
- מדוע עלינו ליישם אופטימיזציות בלמידת מכונה?
- מתי מתרחשת התאמת יתר?
- האם רשתות עצביות קונבולוציוניות יכולות לטפל בנתונים רציפים על ידי שילוב פיתולים לאורך זמן, כפי שמשמשים במודלים מרצף לרצף?
- האם רשתות יריבות גנרטיביות (GANs) מסתמכות על הרעיון של מחולל ומפלה?