בדף הזה מפורטות הנחיות לפיתוח המודלים של TensorFlow באמצעות להמיר לפורמט של מודל LiteRT. המכונה והמודלים של למידת המכונה (ML) שבהם משתמשים ב-LiteRT, נבנו במקור שאומנו באמצעות ספריות וכלים מרכזיים של TensorFlow. אחרי שבניתם מודל בליבה של TensorFlow אפשר להמיר אותו למודל למידת מכונה קטן ויעיל יותר שנקרא מודל LiteRT.
אם יש לכם כבר מודל להמרה, תוכלו לעיין בקטע המרת מודלים כדי לקבל הנחיות לגבי המרת המודל.
בניית המודל שלך
אם אתם יוצרים מודל מותאם אישית לתרחיש הספציפי שלכם, עליכם להתחיל בפיתוח ובאימון של מודל TensorFlow או הרחבה של מודל קיים.
מגבלות בעיצוב המודל
לפני שתתחילו את תהליך פיתוח המודל, שימו לב מגבלות למודלים של LiteRT ולבנות את המודל באמצעות חשוב לזכור:
- יכולות מחשוב מוגבלות – בהשוואה לשרתים מצוידים באופן מלא עם כמה מעבדים (CPU), קיבולת זיכרון גבוהה ומעבדים מיוחדים כמו מעבדי GPU ומעבדי TPU, מכשירים ניידים ומכשירי קצה מוגבלים הרבה יותר. בזמן שהם גידול בעוצמת מחשוב ותאימות חומרה מיוחדת, המודלים והנתונים שאפשר לעבד בהם ביעילות עדיין מוגבלים יחסית.
- גודל המודלים – המורכבות הכוללת של מודל, כולל נתונים את הלוגיקה שלפני עיבוד ואת מספר השכבות במודל, בגודל בזיכרון של המודל. מודל גדול עלול לפעול לאט בצורה בלתי מקובלת או פשוט עשוי שלא להתאים לזיכרון הזמין של מכשיר נייד או מכשיר קצה.
- גודל הנתונים – הגודל של נתוני הקלט שניתן לעבד ביעילות מודל למידת מכונה מוגבל במכשיר נייד או במכשיר קצה. דגמים שמשתמשות בספריות נתונים גדולות כמו ספריות שפה, ספריות תמונות, או שספריות של קליפים לא יתאימו למכשירים האלה, וייתכן שיהיה צורך ופתרונות אחסון וגישה.
- פעולות נתמכות של TensorFlow – סביבות זמן ריצה של LiteRT לתמוך בקבוצת משנה של פעולות של מודל למידת מכונה בהשוואה לפעולות רגילות במודלים של TensorFlow. כשמפתחים מודל לשימוש עם LiteRT, צריך לעקוב אחרי התאימות של המודל ליכולות של סביבות זמן ריצה של LiteRT.
לקבלת מידע נוסף על בניית מודלים יעילים ותואמים לביצועים גבוהים של LiteRT, ראו שיטות מומלצות לביצועים.
פיתוח מודלים
כדי לבנות מודל LiteRT, קודם צריך לבנות מודל באמצעות ספריות הליבה של TensorFlow. ספריות הליבה של TensorFlow הן ברמה הנמוכה יותר ספריות שמספקות ממשקי API ליצירה, אימון ופריסה של מודלים של למידת מכונה.
ב-TensorFlow יש שתי שיטות לעשות את זה. יש לך אפשרות לפתח בקוד של המודל או להתחיל בהטמעה של מודל שזמין Model Garden ב-TensorFlow.
Model Garden
ב-TensorFlow Model Garden יש הרבה הטמעות של מודלים של למידת מכונה (ML) לראייה ולעיבוד שפה טבעית (NLP). יש גם כלים לתהליך עבודה שיאפשרו לך להגדיר ולהפעיל אותם במהירות במערכי נתונים סטנדרטיים. המודלים של למידת המכונה ב-Model Garden קוד מלא, כדי שתוכלו לבדוק, לאמן או לאמן אותם מחדש של מערכי נתונים.
אם אתם רוצים לקבל נקודת השוואה של ביצועים למודל ידוע, מתוצאות של מחקרים שפורסמו לאחרונה, או להרחיב מודלים קיימים, תוכלו להיעזר ב-G Garden כדי להשיג את היעדים שהגדרתם ללמידת מכונה.
מודלים מותאמים אישית
אם התרחיש לדוגמה שלכם לא נכלל באלה שנתמכים על ידי המודלים ב-Model Garden, אפשר להשתמש בספרייה ברמה גבוהה כמו Keras כדי את קוד האימון המותאם אישית. כדי ללמוד את היסודות של TensorFlow, מדריך TensorFlow כדי להתחיל עם לדוגמה, ראו מדריכים של TensorFlow סקירה כללית שכוללת מצביעים אל החל ממדריכים ברמת מומחה.
הערכת המודל
לאחר שפיתחתם את המודל, עליכם להעריך את הביצועים שלו ולבדוק במכשירים של משתמשי קצה. יש כמה דרכים לעשות זאת ב-TensorFlow.
- TensorBoard הוא כלי שמספק מדידות ומחשות שנדרשות תהליך עבודה של למידת מכונה. הוא מאפשר לעקוב אחר מדדי ניסוי כמו הפסד ודיוק, הדמיית תרשים המודל, חיזוי הטמעות לרמה נמוכה יותר מרחב מימדי, ועוד הרבה יותר.
- כלים להשוואה זמינים לכל אחת מהפלטפורמות הנתמכות למשל אפליקציית ההשוואה לשוק של Android ואפליקציית ההשוואה לשוק של iOS. כדאי להשתמש בכלים אלו כדי למדוד ולחשב נתונים סטטיסטיים של ביצועים חשובים מדדים.
אופטימיזציה של המודל
בעזרת המגבלות על משאבים ספציפיים ל-TensorFlow מודלים בסיסיים, אופטימיזציה של מודלים יכולה לעזור להבטיח שביצועי המודל יהיו טובים ומשתמשת בפחות משאבי מחשוב. בדרך כלל, הביצועים של מודל למידת מכונה לאזן בין גודל ומהירות ההסקה לבין דיוק. LiteRT תומכת כרגע באופטימיזציה באמצעות קוונטיזציה, קיצוץ וקיבוץ לאשכולות. צפייה בנושא אופטימיזציה של מודלים, ניתן למצוא פרטים נוספים על שיטות חדשות. ב-TensorFlow יש גם אפשרות לבצע אופטימיזציה של מודלים שמספק ממשק API שמטמיע שיטות חדשות.
השלבים הבאים
- כדי להתחיל לבנות מודל מותאם אישית, מומלץ לעיין במאמר התחלה מהירה למתחילים במדריך הליבה של TensorFlow.
- כדי להמיר מודל TensorFlow בהתאמה אישית, אפשר לעיין במאמר המרת מודלים סקירה כללית.
- אפשר לעיין במדריך בנושא תאימות למפעילים כדי לדעת אם תואם ל-LiteRT, או אם יש צורך שלבים נוספים כדי שתהיה תואמת.
- אפשר לעיין במדריך לשיטות מומלצות לביצועים כדי לקבל הנחיות לגבי שיהפכו את המודלים של LiteRT ליעילים ולביצועים טובים.
- במדריך למדדי הביצועים מוסבר איך למדוד את הביצועים. את ביצועי המודל שלכם באמצעות כלי השוואה לשוק.