Google AI Edge | Google AI for Developers

אנחנו גאים להציג את Google AI Edge Portal: כלי למדידת ביצועים של AI לקצה (Edge AI) בקנה מידה נרחב. להירשם כדי לבקש גישה במהלך התצוגה המקדימה הפרטית.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

הפעלת מודלים של LLM במכשיר באמצעות LiteRT-LM

מסגרת הסקת מסקנות בקוד פתוח שמוכנה לשימוש בסביבת ייצור, ומיועדת לפריסות של מודלים גדולים של שפה (LLM) בפלטפורמות שונות במכשירי קצה, עם ביצועים גבוהים.

סקירה כללית התחל בעבודה

בדיוק בזמן

שיפור משמעותי של Gemma 4 בהסקת מסקנות במכשיר באמצעות Multi-Token Prediction (MTP). מהירויות פענוח מהירות פי 2 ומעלה במעבדים גרפיים בניידים, ללא פגיעה באיכות.

פוסט בבלוג מדריך

למה LiteRT-LM?

פלטפורמות שונות

פריסת מודלים של שפה גדולה ב-Android, ב-iOS, באינטרנט ובמחשב.

שיפור מהירות באמצעות חומרה

שיפור הביצועים באמצעות האצת GPU ו-NPU.

יכולות רחבות של AI גנרטיבי

תמיכה במודלים פופולריים של LLM, כמו גם במולטי-מודאליות (ראייה, אודיו) ובשימוש בכלי עזר.

אני רוצה להתחיל לפתח

Python

ממשקי API של Python עם שיפור המהירות באמצעות חומרה ב-Linux, ב-MacOS, ב-Windows וב-Raspberry Pi.

מדריך ל-Python

Android

אפליקציות מקוריות ל-Android וכלים למחשב שמבוססים על JVM.

מדריך ל-Android

iOS

שילוב מקורי של iOS ו-macOS עם תמיכה מיוחדת ב-Metal (ממשקי Swift API יהיו זמינים בקרוב).

מדריך C++‎

C++

‫x-platform C++ APIs .

מדריך C++‎

להצטרפות לקהילה

‫LiteRT-LM ב-GitHub

אפשר לתרום לפרויקט הקוד הפתוח, לדווח על בעיות ולראות דוגמאות.

הצגה ב-GitHub

Hugging Face

אתם יכולים להוריד מודלים שעברו המרה מראש (Gemma,‏ Qwen ועוד) ולהצטרף לדיון.

הצגה ב-Hugging Face

בלוגים והודעות

עם Gemma 4, אתם יכולים להשתמש ביכולות המתקדמות ביותר של AI אקטיבי.

אפשר לפרוס את Gemma 4 באפליקציה ובמגוון רחב יותר של מכשירים עם ביצועים מעולים ופוטנציאל חשיפה רחב באמצעות LiteRT-LM.

‫AI גנרטיבי במכשיר ב-Chrome, ב-Chromebook Plus וב-Pixel Watch

פריסת מודלים של שפה במכשירים לבישים ובפלטפורמות מבוססות-דפדפן באמצעות LiteRT-LM בקנה מידה נרחב.

קריאה לפונקציות במכשיר בגלריית Google AI Edge API

במאמר הזה מוסבר איך לבצע כוונון עדין של FunctionGemma ואיך להפעיל יכולות של בקשות להפעלת פונקציות שמבוססות על ממשקי API של LiteRT-LM Tool Use.

מודלים קטנים של שפה (LLM) של Google AI Edge, מולטי-מודאליות וקריאה לפונקציות

תובנות עדכניות לגבי RAG, מולטי-מודאליות ובקשות להפעלת פונקציות במודלים של שפה שפועלים במכשירים.

אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers‏.‏ Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.

עדכון אחרון: 2026-05-05 (שעון UTC).