Leitfaden zu Einbettungen

Der Einbettungsdienst in der Gemini API generiert hochmoderne Einbettungen für Wörter, Wortgruppen und Sätze. Die resultierenden Einbettungen können dann für NLP-Aufgaben wie semantische Suche, Textklassifizierung und Clustering verwendet werden. Auf dieser Seite wird beschrieben, was Einbettungen sind. Außerdem werden einige wichtige Anwendungsfälle für den Einbettungsdienst vorgestellt, um Ihnen den Einstieg zu erleichtern.

Was sind Einbettungen?

Texteinbettungen sind eine NLP-Methode (Natural Language Processing), die Text in numerische Vektoren umwandelt. Einbettungen erfassen die semantische Bedeutung und den Kontext, was dazu führt, dass Text mit ähnlichen Bedeutungen engere Einbettungen hat. Die Einbettungen „Ich brachte meinen Hund zum Tierarzt“ und „Ich brachte meine Katze zum Tierarzt“ würden beispielsweise Einbettungen haben, die im Vektorraum nahe beieinander liegen, da beide einen ähnlichen Kontext beschreiben.

Dies ist wichtig, da damit viele Algorithmen entsperrt werden, die mit Vektoren, aber nicht direkt mit Text arbeiten können.

Mit diesen Einbettungen oder Vektoren können Sie verschiedene Texte vergleichen und verstehen, wie sie zusammenhängen. Wenn beispielsweise die Einbettungen des Textes „Katze“ und „Hund“ nah beieinander sind, können Sie daraus ableiten, dass die Bedeutung, der Kontext oder beides ähnlich ist. Diese Funktion ermöglicht eine Vielzahl von Anwendungsfällen, die im nächsten Abschnitt beschrieben werden.

Anwendungsfälle

Texteinbettungen unterstützen eine Vielzahl von NLP-Anwendungsfällen. Beispiel:

Elastische Einbettungen

Das Gemini-Modell zur Texteinbettung, das mit text-embedding-004 beginnt, bietet elastische Einbettungsgrößen unter 768. Mit elastischen Einbettungen können Sie kleinere Ausgabedimensionen generieren und möglicherweise Rechen- und Speicherkosten mit geringfügigen Leistungsverlusten sparen.

Nächste Schritte

  • Wenn Sie bereit sind, mit der Entwicklung zu beginnen, finden Sie den vollständigen ausführbaren Code in den Kurzanleitungen für Python, Go, Node.js und Dart (Flutter).