שירות ההטמעה ב-Gemini API יוצר הטמעות מתקדמות למילים, לביטויים ולמשפטים. אפשר להשתמש בהטמעות שיתקבלו למשימות NLP, כמו חיפוש סמנטי, סיווג טקסט וקיבוץ לאשכולות ועוד. בדף הזה נסביר מהן הטמעות, ונדגיש כמה תרחישי שימוש מרכזיים לשירות ההטמעה כדי לעזור לכם להתחיל.
מהן הטמעות?
הטמעות טקסט הן שיטה של עיבוד שפה טבעית (NLP) שממירה טקסט לווקטורים מספריים. הטמעות לוכדות את המשמעות הסמנטית וההקשר, וכתוצאה מכך מתקבל טקסט עם משמעויות דומות עם הטמעות קרובות יותר. לדוגמה, במשפט "לקחתי את הכלב שלי לווטרינר" ו "לקחתי את החתול שלי לווטרינר", צריכות להיות הטמעות קרובות זו לזו במרחב הווקטורי כי שניהם מתארים הקשר דומה.
זה חשוב כי כך פותחים אלגוריתמים רבים שיכולים לפעול על וקטורים אבל לא ישירות על טקסט.
ניתן להשתמש בווקטורים או בהטמעות כדי להשוות בין טקסטים שונים ולהבין את הקשר ביניהם. לדוגמה, אם ההטמעות של הטקסט "חתול" ו"כלב" קרובות זו לזו, אפשר להסיק שהמילים דומות במשמעות או בהקשר או בשניהם. היכולת הזו מאפשרת מגוון תרחישים לדוגמה שמתוארים בקטע הבא.
תרחישים לדוגמה
הטמעות טקסט מסייעות במגוון תרחישים לדוגמה של NLP. למשל:
- אחזור מידע: המטרה היא לאחזר טקסט דומה מבחינה סמנטית לקטע טקסט קלט. מערכת לאחזור מידע יכולה לתמוך במגוון אפליקציות, כמו חיפוש סמנטי, מענה על שאלות או סיכום. ראו דוגמה לכך ב-notebook של חיפוש המסמכים.
- סיווג: אפשר להשתמש בהטמעות כדי לאמן מודל לסווג מסמכים לקטגוריות. לדוגמה, אם רוצים לסווג תגובות של משתמשים כשליליות או כחיוביות, אפשר להשתמש בשירות ההטמעה כדי לקבל ייצוג בווקטור של כל תגובה כדי לאמן את המסווג. לפרטים נוספים, קראו את הדוגמה למסווג Gemini.
- אשכולות: השוואת וקטורים של טקסט יכולה להראות עד כמה הם דומים או שונים. אפשר להשתמש בתכונה הזו כדי לאמן מודל אשכולות שמקבץ טקסט או מסמכים דומים וכדי לזהות חריגות בנתונים.
- Vector DB: אפשר לאחסן את ההטמעות שנוצרו באמצעות DB וקטורי, כדי לשפר את הדיוק והיעילות של האפליקציה NLP. בדף הזה מוסבר איך משתמשים ב-DB וקטורי כדי לתרגם הנחיות טקסט לווקטורים מספריים.
הטמעות אלסטיות
המודל 'הטמעת טקסט ב-Gemini', שמתחיל ב-text-embedding-004
, מציע גדלים של הטמעה גמישה עד ל-768.
אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר, וכך לחסוך בעלויות מחשוב ואחסון עם ירידה קלה בביצועים.
המאמרים הבאים
- אם אתם מוכנים להתחיל לפתח, תוכלו למצוא קוד מלא להרצה במדריכים למתחילים של Python, Go, Node.js ו-Dart (Flutter).