סקירה כללית על הטמעת מודל Gemma

‫EmbeddingGemma הוא מודל הטמעה של טקסט רב-לשוני עם 308 מיליון פרמטרים שמבוסס על Gemma 3. הוא מותאם לשימוש במכשירים יומיומיים, כמו טלפונים, מחשבים ניידים וטאבלטים. המודל יוצר ייצוגים מספריים של טקסט לשימוש במשימות downstream כמו אחזור מידע, חיפוש של דמיון סמנטי, סיווג וקלאסטרינג.

התכונות העיקריות של EmbeddingGemma:

  • תמיכה רב-לשונית: הבנה רחבה של נתונים לשוניים, שאומנה ביותר מ-100 שפות.
  • מימדים גמישים של פלט: אפשר להתאים אישית את מימדי הפלט מ-768 ל-128 כדי לאזן בין מהירות לאחסון באמצעות Matryoshka Representation Learning ‏ (MRL).
  • הקשר של 2,000 טוקנים: הקשר קלט משמעותי לעיבוד נתוני טקסט ומסמכים ישירות בחומרה.
  • יעיל מבחינת אחסון: אפשר להריץ אותו עם פחות מ-200MB של RAM עם קוונטיזציה
  • זמן אחזור נמוך: הטמעות גנרטיביות בפחות מ-22ms ב-EdgeTPU לאפליקציות מהירות וזורמות.
  • אופליין ומאובטח: אפשר ליצור הטמעות של מסמכים ישירות בחומרה שלכם, והכלי פועל ללא חיבור לאינטרנט כדי לשמור על נתונים רגישים.

להורדה מ-Hugging Face להורדה מ-Kaggle גישה ב-Vertex

בדומה למודלים אחרים של Gemma, ‏ EmbeddingGemma מסופק עם משקלים פתוחים ועם רישיון לשימוש מסחרי אחראי, שמאפשר לכם לבצע כוונון עדין ולפרוס אותו בפרויקטים ובאפליקציות שלכם.

התנסות בהטמעה של Gemma התאמה אישית של הטמעה של Gemma