אנחנו גאים להציג את Google AI Edge Portal: כלי למדידת ביצועים של AI לקצה (Edge AI) בקנה מידה נרחב. להירשם כדי לבקש גישה במהלך התצוגה המקדימה הפרטית.

Deploy GenAI Models with LiteRT

‫LiteRT מאפשר פריסה של מודלים של AI גנרטיבי בנייד, במחשב ובפלטפורמות אינטרנט, עם ביצועים גבוהים. ‫LiteRT משתמשת בצורה חלקה בהאצת חומרה ממעבדים, ממעבדים גרפיים וממעבדים עצביים, ומספקת ביצועים מתקדמים להסקת מסקנות של AI גנרטיבי במכשיר.

אפשר לפרוס מודלים מורכבים של AI גנרטיבי באמצעות חבילת הטכנולוגיות המשולבת הבאה:

‫Torch Generative API: מודול Python בספריית LiteRT Torch ליצירה ולהמרה של מודלים של PyTorch GenAI. הוא מספק אבני בניין שעברו אופטימיזציה כדי להבטיח ביצועים גבוהים במכשירים. לפרטים נוספים, אפשר לעיין במאמר בנושא המרת מודלים של AI גנרטיבי ב-PyTorch.
‫LiteRT-LM: שכבת תזמור מיוחדת שמבוססת על LiteRT כדי לנהל מורכבויות ספציפיות ל-LLM, כמו שיבוט סשנים, ניהול מטמון kv, שמירת הנחיות במטמון/דירוג והסקת מסקנות עם שמירת מצב. פרטים נוספים זמינים במאגר LiteRT-LM ב-GitHub.
‫LiteRT Converter ו-Runtime: מנוע בסיסי שמספק המרת מודלים יעילה, הרצה ואופטימיזציה, ומאפשר שיפור מהירות מתקדם באמצעות חומרה ב-CPU, ב-GPU וב-NPU.

מאגר מודלים של AI גנרטיבי של LiteRT

‫LiteRT תומך באוסף הולך וגדל של מודלים פופולריים עם משקלים פתוחים ב-LiteRT Hugging Face Community. המודלים האלה מומרים מראש ומותאמים לפריסה מיידית, כך שתוכלו להפיק מהם את הביצועים הכי טובים במעבדי CPU,‏ GPU ו-NPU כבר מההתחלה.

Gemma Family
- Gemma 3 270M
- Gemma 3 1B
- ‫Gemma 3n E2B/E4B
- הטמעה של Gemma 300M: ראו EmbeddingGemma semantic similarity LiteRT C++ App
- הפונקציה Gemma 270M
Qwen Family
Llama
Phi
SmoLM
FastVLM

Deploy GenAI Models with LiteRT

מאגר מודלים של AI גנרטיבי של LiteRT

תובנות מומלצות