בעת שימוש ב-CMLE (Cloud Machine Learning Engine) ליצירת גרסה, יש צורך לציין מקור של מודל מיוצא. דרישה זו חשובה מכמה סיבות, שיוסברו בהרחבה בתשובה זו.
ראשית, בואו נבין מה הכוונה ב"מודל מיוצא". בהקשר של CMLE, מודל מיוצא מתייחס למודל למידת מכונה מאומן שנשמר או יוצא בפורמט שניתן להשתמש בו לחיזוי. ניתן לאחסן את הדגם המיוצא הזה בפורמטים שונים כגון TensorFlow SavedModel, TensorFlow Lite, או אפילו פורמט מותאם אישית.
כעת, מדוע יש צורך לציין מקור של מודל מיוצא בעת יצירת גרסה ב-CMLE? הסיבה נעוצה בזרימת העבודה של CMLE והצורך לספק את המשאבים הדרושים לשרת המודל. בעת יצירת גרסה, CMLE צריך לדעת היכן ממוקם המודל המיוצא כך שניתן יהיה לפרוס אותו ולהפוך אותו לזמין לחיזוי.
על ידי ציון המקור של המודל המיוצא, CMLE יכול לאחזר ביעילות את המודל ולטעון אותו לתשתית המשרתת. זה מאפשר למודל להיות מוכן לבקשות חיזוי מלקוחות. בלי לציין את המקור, CMLE לא ידע היכן למצוא את המודל ולא יוכל לשרת תחזיות.
בנוסף, ציון המקור של המודל המיוצא מאפשר ל-CMLE לטפל בניהול גרסאות ביעילות. בלמידת מכונה, מקובל להתאמן ולחזור על מודלים, ולשפר אותם עם הזמן. CMLE מאפשר לך ליצור גרסאות מרובות של מודל, כל אחת מייצגת איטרציה או שיפור שונה. על ידי ציון המקור של המודל המיוצא, CMLE יכול לעקוב אחר גרסאות אלו ולהבטיח שהמודל הנכון יוגש עבור כל בקשת חיזוי.
כדי להמחיש זאת, שקול תרחיש שבו מהנדס למידת מכונה מאמן מודל באמצעות TensorFlow ומייצא אותו בתור SavedModel. לאחר מכן, המהנדס משתמש ב-CMLE כדי ליצור גרסה של המודל, תוך ציון המקור כקובץ SavedModel המיוצא. CMLE פורס את המודל והופך אותו לזמין לחיזוי. כעת, אם המהנדס מאמן מאוחר יותר גרסה משופרת של המודל וייצא אותה כ- SavedModel חדש, הם יכולים ליצור גרסה נוספת ב-CMLE, תוך ציון הדגם המיוצא החדש כמקור. זה מאפשר ל-CMLE לנהל את שתי הגרסאות בנפרד ולשרת את המודל המתאים בהתבסס על הגרסה שצוינה בבקשות חיזוי.
בעת שימוש ב-CMLE ליצירת גרסה, ציון מקור של מודל מיוצא נחוץ כדי לספק את המשאבים הדרושים להגשת המודל, לאפשר אחזור וטעינה יעילים של המודל, ולתמוך בגירסאות של מודלים.
שאלות ותשובות אחרונות אחרות בנושא התקדמות בלימוד מכונה:
- כאשר קרנל מזולג עם נתונים והמקור הוא פרטי, האם המזלג יכול להיות ציבורי ואם כן אין מדובר בהפרת פרטיות?
- מהן המגבלות בעבודה עם מערכי נתונים גדולים בלמידת מכונה?
- האם למידת מכונה יכולה לעזור קצת?
- מהו מגרש המשחקים TensorFlow?
- האם מצב להוט מונע את פונקציונליות המחשוב המבוזר של TensorFlow?
- האם ניתן להשתמש בפתרונות הענן של Google כדי לנתק מחשוב מאחסון לצורך אימון יעיל יותר של מודל ה-ML עם נתונים גדולים?
- האם Google Cloud Machine Learning Engine (CMLE) מציע רכישה ותצורה אוטומטית של משאבים ומטפל בכיבוי משאבים לאחר סיום ההכשרה של המודל?
- האם ניתן לאמן מודלים של למידת מכונה על מערכי נתונים גדולים באופן שרירותי ללא שיהוקים?
- האם CMLE יכול לקרוא נתוני אחסון מ-Google Cloud ולהשתמש במודל מיומן שצוין להסקת מסקנות?
- האם ניתן להשתמש ב-Tensorflow לאימון והסקת רשתות עצביות עמוקות (DNNs)?
צפה בשאלות ותשובות נוספות ב-Advance in Machine Learning