نظرة عامة على نموذج EmbeddingGemma

‫EmbeddingGemma هو نموذج لتضمين النصوص بلغات متعدّدة يتضمّن 308 مليون مَعلمة ويستند إلى Gemma 3. وهي محسّنة للاستخدام في الأجهزة اليومية، مثل الهواتف وأجهزة الكمبيوتر المحمولة والأجهزة اللوحية. ينتج النموذج تمثيلات رقمية للنص لاستخدامها في مهام لاحقة، مثل استرجاع المعلومات والبحث عن التشابه الدلالي والتصنيف والتجميع العنقودي.

تتضمّن EmbeddingGemma الميزات الرئيسية التالية:

  • التوافق مع اللغات المتعددة: فهم واسع للبيانات اللغوية، تم تدريبه على أكثر من 100 لغة
  • أبعاد إخراج مرنة: يمكنك تخصيص أبعاد الإخراج من 768 إلى 128 لتحقيق التوازن بين السرعة والتخزين باستخدام تقنية Matryoshka Representation Learning (MRL).
  • سياق الرمز المميز 2K: سياق إدخال كبير لمعالجة البيانات النصية والمستندات مباشرةً على جهازك
  • كفاءة في استخدام مساحة التخزين: يمكن تشغيلها على أقل من 200 ميغابايت من ذاكرة الوصول العشوائي مع التكميم
  • وقت استجابة منخفض: يمكن إنشاء التضمينات التوليدية في أقل من 22 ملي ثانية على EdgeTPU لإنشاء تطبيقات سريعة وسلسة.
  • بلا إنترنت وبأمان: يمكنك إنشاء تضمينات للمستندات مباشرةً على جهازك بدون اتصال بالإنترنت للحفاظ على أمان البيانات الحساسة.

الحصول على النموذج على Hugging Face الحصول على النموذج على Kaggle الوصول إلى النموذج على Vertex

وكما هو الحال مع نماذج Gemma الأخرى، يتم توفير EmbeddingGemma مع أوزان مفتوحة ومرخّصة للاستخدام التجاري المسؤول، ما يتيح لك إجراء التعديلات الدقيقة ونشرها في مشاريعك وتطبيقاتك.

تجربة EmbeddingGemma ضبط EmbeddingGemma