Google AI Edge | Google AI for Developers

אנחנו גאים להציג את Google AI Edge Portal: כלי למדידת ביצועים של AI לקצה (Edge AI) בקנה מידה נרחב. להירשם כדי לבקש גישה במהלך התצוגה המקדימה הפרטית.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

הפעלת מודלים של LLM במכשיר באמצעות LiteRT-LM

מסגרת הסקת מסקנות בקוד פתוח שמוכנה לשימוש בסביבת ייצור, ומיועדת לפריסות של מודלים גדולים של שפה (LLM) בפלטפורמות שונות במכשירי קצה, עם ביצועים גבוהים.

סקירה כללית התחל בעבודה

בדיוק בזמן

בבלוג האחרון שלנו תוכלו לקרוא איך LiteRT-LM משפר את הפריסות של AI גנרטיבי במכשיר, וממצה את הפוטנציאל של Gemma 4 במהירות גבוהה וביעילות מדהימה באמצעות ממשקי API חדשים של Swift,‏ JavaScript ו-Flutter.

פוסט בבלוג סקירה כללית

למה LiteRT-LM?

פלטפורמות שונות

פריסת מודלים של שפה גדולה ב-Android, ב-iOS, באינטרנט ובמחשב.

שיפור מהירות באמצעות חומרה

שיפור הביצועים באמצעות האצת GPU ו-NPU.

יכולות רחבות של AI גנרטיבי

תמיכה במודלים פופולריים של LLM, כמו גם במולטי-מודאליות (ראייה, אודיו) ובשימוש בכלי עזר.

אני רוצה להתחיל לפתח

Python

ממשקי API של Python עם שיפור המהירות באמצעות חומרה ב-Linux, ב-MacOS, ב-Windows וב-Raspberry Pi.

מדריך ל-Python

Android

אפליקציות מקוריות ל-Android וכלים למחשב שמבוססים על JVM.

מדריך ל-Android

iOS

ממשקי API מקוריים של Swift ל-iOS (בקרוב גם ל-macOS).

מדריך Swift

Web

ממשקי JavaScript ו-TypeScript API לאפליקציות אינטרנט מבוססות-דפדפן עם האצת WebGPU.

מדריך האינטרנט

Flutter

יצירת אפליקציות Flutter חוצות-פלטפורמות באמצעות חבילת flutter_gemma שמתוחזקת על ידי הקהילה.

מדריך Flutter

C++

‫x-platform C++ APIs .

מדריך C++‎

File Builder

ליצור קובצי ‎ .litertlm ממודלים של LiteRT שהומרו.

מדריך ליצירת קבצים

להצטרפות לקהילה

‫LiteRT-LM ב-GitHub

אפשר לתרום לפרויקט הקוד הפתוח, לדווח על בעיות ולראות דוגמאות.

הצגה ב-GitHub

Hugging Face

אתם יכולים להוריד מודלים שעברו המרה מראש (Gemma,‏ Qwen ועוד) ולהצטרף לדיון.

הצגה ב-Hugging Face

בלוגים והודעות

שיפור משמעותי של Gemma 4 בהסקת מסקנות במכשיר באמצעות Multi-Token Prediction (MTP)

מהירויות פענוח מהירות פי 2 ומעלה במעבדים גרפיים בניידים, ללא פגיעה באיכות.

עם Gemma 4, אתם יכולים להשתמש ביכולות המתקדמות ביותר של AI אקטיבי.

אפשר לפרוס את Gemma 4 באפליקציה ובמגוון רחב יותר של מכשירים עם ביצועים מעולים ופוטנציאל חשיפה רחב באמצעות LiteRT-LM.

‫AI גנרטיבי במכשיר ב-Chrome, ב-Chromebook Plus וב-Pixel Watch

פריסת מודלים של שפה במכשירים לבישים ובפלטפורמות מבוססות-דפדפן באמצעות LiteRT-LM בקנה מידה נרחב.

קריאה לפונקציות במכשיר בגלריית Google AI Edge API

במאמר הזה מוסבר איך לבצע כוונון עדין של FunctionGemma ואיך להפעיל יכולות של בקשות להפעלת פונקציות שמבוססות על ממשקי API של LiteRT-LM Tool Use.

מודלים קטנים של שפה (LLM) של Google AI Edge, מולטי-מודאליות וקריאה לפונקציות

תובנות עדכניות לגבי RAG, מולטי-מודאליות ובקשות להפעלת פונקציות במודלים של שפה שפועלים במכשירים.

אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers‏.‏ Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.

עדכון אחרון: 2026-05-19 (שעון UTC).