تنشئ خدمة التضمين في واجهة برمجة تطبيقات Gemini عمليات تضمين حديثة للكلمات والعبارات والجُمل. يمكن بعد ذلك استخدام التضمينات الناتجة في مهام برنامج NLP، مثل البحث الدلالي، وتصنيف النص، والتجميع العنقودي وغير ذلك الكثير. تصف هذه الصفحة ماهية التضمينات وتسلّط الضوء على بعض حالات الاستخدام الرئيسية لخدمة التضمين لمساعدتك على البدء.
ما المقصود بالتضمين؟
تضمينات النص هي تقنية معالجة لغة طبيعية (NLP) تعمل على تحويل النص إلى متجهات عددية. تجمع التضمينات المعنى والسياق الدلالي، مما يؤدي إلى تضمين نصوص ذات معانٍ متشابهة. على سبيل المثال، سيكون للجملة "أخذت كلبي إلى الطبيب البيطري" و "أخذت قطتي إلى طبيب بيطري" تضمينات قريبة من بعضها البعض في المساحة المتجهة لأن كلاهما يصف سياقًا مشابهًا.
وهذا مهم لأنه يفتح العديد من الخوارزميات التي يمكنها العمل على المتجهات ولكن ليس على النص مباشرةً.
يمكنك استخدام هذه التضمينات أو المتجهات لمقارنة النصوص المختلفة وفهم ارتباطها ببعضها. على سبيل المثال، إذا كان النصان "قطة" و"كلب" متقاربَين، يمكنك استنتاج أنّ هاتين الكلمتين متشابهتان في المعنى أو السياق أو كليهما. وتتيح هذه الإمكانية مجموعة متنوعة من حالات الاستخدام الموضّحة في القسم التالي.
حالات الاستخدام
تعمل تضمينات النص على تعزيز مجموعة متنوعة من حالات استخدام معالجة اللغات الطبيعية. مثال:
- استرجاع المعلومات: الهدف هو استرداد النص المتشابه دلاليًا الذي يتم منحه جزءًا من نص الإدخال. يمكن استخدام مجموعة متنوعة من التطبيقات من خلال نظام لاسترجاع المعلومات مثل البحث الدلالي أو الإجابة عن الأسئلة أو التلخيص. يُرجى الرجوع إلى دفتر ملاحظات البحث في المستندات للاطّلاع على مثال.
- التصنيف: يمكنك استخدام التضمينات لتدريب نموذج لتصنيف المستندات إلى فئات. على سبيل المثال، إذا كنت تريد تصنيف تعليقات المستخدمين على أنّها سلبية أو إيجابية، يمكنك استخدام خدمة التضمين للحصول على التمثيل المتّجه لكل تعليق بهدف تدريب المصنِّف. يمكنك الرجوع إلى مثال على مصنِّف Gemini للاطّلاع على مزيد من التفاصيل.
- التجميع العنقودي: يمكن أن تؤدي مقارنة متجهات النص إلى توضيح مدى تشابهها أو اختلافها. يمكن استخدام هذه الميزة لتدريب نموذج تجميعي يجمع بين النصوص أو المستندات المتشابهة معًا واكتشاف القيم الشاذة في بياناتك.
- Vector DB: يمكنك تخزين عمليات التضمين التي تم إنشاؤها في قاعدة بيانات متجهة لتحسين دقة وفعالية تطبيق NLP. راجع هذه الصفحة للتعرف على كيفية استخدام قاعدة بيانات متجهة لترجمة الطلبات النصية إلى متجهات رقمية.
تضمينات مرنة
يوفّر نموذج تضمين النص في Gemini، الذي يبدأ بـ text-embedding-004
، أحجام تضمين مرنة تقلّ عن 768. ويمكنك استخدام التضمينات المرنة
لإنشاء أبعاد أصغر للمخرجات وربما توفير تكاليف الحوسبة والتخزين
مع انخفاض طفيف في الأداء.
الخطوات التالية
- إذا كنت مستعدًا لبدء تطوير البرامج، يمكنك العثور على الرمز البرمجي الكامل القابل للتشغيل في علامات بدء التشغيل السريعة لكل من Python وGo وNode.js وDart (Flutter).