תחום למידת מכונה מקיף מגוון מתודולוגיות ופרדיגמות, כל אחת מתאימה לסוגים שונים של נתונים ובעיות. בין הפרדיגמות הללו, למידה מפוקחת ובלתי מפוקחת הן שתיים מהבסיסיות ביותר.
למידה מפוקחת כרוכה באימון מודל על מערך נתונים מסומן, שבו נתוני הקלט מזווגים עם הפלט הנכון. המודל לומד למפות תשומות לתפוקות על ידי מזעור השגיאה בין התחזיות שלו לתפוקות בפועל. למידה ללא פיקוח, לעומת זאת, עוסקת בנתונים לא מסומנים, כאשר המטרה היא להסיק את המבנה הטבעי הקיים בתוך קבוצה של נקודות נתונים.
קיים סוג של למידה המשלב טכניקות למידה מפוקחות ובלתי מפוקחות, המכונה לעתים קרובות למידה מפוקחת למחצה. גישה זו ממנפת נתונים מסומנים ובלתי מסומנים במהלך תהליך האימון. הרציונל מאחורי למידה מפוקחת למחצה היא שנתונים לא מסומנים, כאשר משתמשים בהם בשילוב עם כמות קטנה של נתונים מסומנים, יכולים לייצר שיפור ניכר ברמת דיוק הלמידה. זה שימושי במיוחד בתרחישים שבהם נתונים מסומנים נדירים או יקרים להשגה, אך נתונים ללא תווית הם בשפע וקל לאיסוף.
למידה מפוקחת למחצה מבוססת על ההנחה שהמבנה הבסיסי של הנתונים הלא מסומנים יכול לספק מידע בעל ערך המשלים לנתונים המסומנים. הנחה זו יכולה ללבוש מספר צורות, כגון הנחת אשכול, הנחה מגוונת או הנחת הפרדה בצפיפות נמוכה. הנחת האשכול מניחה שנקודות נתונים באותו אשכול צפויות להיות עם אותה תווית. ההנחה המגוונת מצביעה על כך שנתונים בממדים גבוהים נמצאים על מכלול בעל מימדיות נמוכה בהרבה, והמשימה היא ללמוד את המגוון הזה. הנחת ההפרדה בצפיפות נמוכה מבוססת על הרעיון שגבול ההחלטה צריך להיות באזור של צפיפות נתונים נמוכה.
אחת הטכניקות הנפוצות בלמידה בפיקוח למחצה היא אימון עצמי. באימון עצמי, מודל מאומן תחילה על הנתונים המסומנים. לאחר מכן הוא משתמש בתחזיות משלו על הנתונים הלא מסומנים בתור תוויות פסאודו. המודל עובר הכשרה נוספת על מערך הנתונים המוגדל הזה, ומשכלל באופן איטרטיבי את התחזיות שלו. טכניקה נוספת היא אימון משותף, שבו שני מודלים או יותר מאומנים בו-זמנית על תצוגות שונות של הנתונים. כל מודל אחראי לתיוג חלק מהנתונים שאינם מסומנים, אשר משמש לאחר מכן לאימון המודלים האחרים. שיטה זו מנצלת את היתירות במספר תצוגות של הנתונים כדי לשפר את ביצועי הלמידה.
שיטות מבוססות גרפים נפוצות גם בלמידה מפוקחת למחצה. שיטות אלה בונות גרף שבו צמתים מייצגים נקודות נתונים, וקצוות מייצגים קווי דמיון ביניהם. לאחר מכן, משימת הלמידה מנוסחת מחדש כבעיית אופטימיזציה מבוססת גרפים, כאשר המטרה היא להפיץ תוויות מהצמתים המסומנים לאלו שאינם מתויגים תוך שמירה על מבנה הגרף. טכניקות אלו יעילות במיוחד בתחומים שבהם הנתונים יוצרים רשת באופן טבעי, כגון רשתות חברתיות או רשתות ביולוגיות.
גישה נוספת לשילוב למידה מפוקחת ובלתי מפוקחת היא באמצעות למידה מרובה משימות. בלמידה מרובה משימות, משימות למידה מרובות נפתרות בו-זמנית, תוך ניצול המשותף וההבדלים בין המשימות. ניתן לראות זאת כצורה של העברה אינדוקטיבית, שבה ידע שנרכש ממשימה אחת עוזר לשפר את הלמידה של אחרת. למידה מרובה משימות יכולה להיות מועילה במיוחד כאשר יש ייצוג משותף או מרחב תכונה בין המשימות, המאפשר העברת מידע.
דוגמה מעשית ללמידה בפיקוח למחצה היא בתחום עיבוד השפה הטבעית (NLP). שקול את המשימה של ניתוח סנטימנטים, כאשר המטרה היא לסווג טקסט נתון כחיובי או שלילי. נתונים מסומנים, כגון ביקורות עם תוויות סנטימנט, עשויים להיות מוגבלים. עם זאת, יש כמות עצומה של טקסט ללא תווית זמינה. גישת למידה מפוקחת למחצה יכולה לכלול הכשרת מסווג סנטימנטים על הנתונים המסומנים ושימוש בהם כדי לחזות את הסנטימנט של הנתונים הלא מסומנים. תחזיות אלו יכולות לשמש כנתוני אימון נוספים, ולשפר את הביצועים של המסווגן.
דוגמה נוספת ניתן למצוא בסיווג תמונה. במקרים רבים, השגת תמונות מתויגות היא עתירת עבודה ויקרה, בעוד שתמונות ללא תווית הן בשפע. גישה מפוקחת למחצה עשויה לכלול שימוש בסט קטן של תמונות מסומנות כדי להכשיר מודל ראשוני. לאחר מכן ניתן להחיל מודל זה על התמונות ללא תווית כדי ליצור תוויות פסאודו, אשר משמשות לאחר מכן לאימון מחדש של המודל.
השילוב של למידה מפוקחת ובלתי מפוקחת באמצעות למידה מפוקחת למחצה ומתודולוגיות קשורות מייצגת גישה רבת עוצמה בלמידת מכונה. על ידי מינוף החוזקות של שתי הפרדיגמות, ניתן להשיג שיפורים משמעותיים בביצועי המודל, במיוחד בתחומים שבהם הנתונים המסומנים מוגבלים אך נתונים ללא תווית מצויים בשפע. גישה זו לא רק משפרת את יכולתם של מודלים להכליל מנתונים מוגבלים, אלא גם מספקת מסגרת חזקה יותר להבנת המבנה הבסיסי של מערכי נתונים מורכבים.
שאלות ותשובות אחרונות אחרות בנושא EITC/AI/GCML Google Cloud Machine Learning:
- הזכרת הרבה סוגים של אלגוריתמים כמו רגרסיה לינארית, עצי החלטה. האם כל אלה רשתות נוירונים?
- מהם מדדי הערכת הביצועים של מודל?
- מהי רגרסיה לינארית?
- האם ניתן לשלב מודלים שונים של ML ולבנות AI מאסטר?
- מהם כמה מהאלגוריתמים הנפוצים ביותר בשימוש בלמידת מכונה?
- כיצד ליצור גרסה של המודל?
- כיצד ליישם את 7 השלבים של ML בהקשר לדוגמה?
- כיצד ניתן ליישם למידת מכונה על נתוני היתרי בנייה?
- מדוע הופסקה הייצור של AutoML Tables ומה ימשיך אותם?
- מהי המשימה לפרש שרבוטים שצוירו על ידי שחקנים בהקשר של AI?
הצג שאלות ותשובות נוספות ב-EITC/AI/GCML Google Cloud Machine Learning
עוד שאלות ותשובות:
- שדה: בינה מלאכותית
- תכנית: EITC/AI/GCML Google Cloud Machine Learning (ללכת לתוכנית ההסמכה)
- שיעור: מבוא (עבור לשיעור בנושא)
- נושא: מהי למידת מכונה (עבור לנושא קשור)