Gemini API, एम्बेड करने के कई मॉडल के साथ काम करता है. ये मॉडल, शब्दों, वाक्यांशों, कोड, और वाक्यों के लिए सबसे बेहतर एम्बेड जनरेट करते हैं. इसके बाद, इन एम्बेड का इस्तेमाल कई कामों के लिए किया जा सकता है. जैसे, सेमैनटिक सर्च, टेक्स्ट का क्लासिफ़िकेशन, और क्लस्टरिंग वगैरह.
एम्बेड क्या होते हैं?
एम्बेडमेंट, सेमैनटिक मतलब और संदर्भ को कैप्चर करते हैं. इससे, मिलते-जुलते मतलब वाले टेक्स्ट में "ज़्यादा" एम्बेडमेंट होते हैं. उदाहरण के लिए, "मैंने अपने कुत्ते को डॉक्टर के पास ले गया" और "मैंने अपनी बिल्ली को डॉक्टर के पास ले गया" वाक्यों के एम्बेड, वेक्टर स्पेस में एक-दूसरे के करीब होंगे, क्योंकि दोनों वाक्यों में एक जैसा कॉन्टेक्स्ट है.
अलग-अलग टेक्स्ट की तुलना करने और यह समझने के लिए कि वे एक-दूसरे से कैसे जुड़े हैं, एम्बेड का इस्तेमाल किया जा सकता है. उदाहरण के लिए, अगर टेक्स्ट "बिल्ली" और "कुत्ता" के एम्बेड एक-दूसरे के करीब हैं, तो इससे यह अनुमान लगाया जा सकता है कि ये शब्द मतलब, संदर्भ या दोनों में मिलते-जुलते हैं. इससे, एआई के सामान्य इस्तेमाल के उदाहरण की संख्या बढ़ती है.
एम्बेड जनरेट करना
टेक्स्ट एम्बेड जनरेट करने के लिए, embedContent
तरीके का इस्तेमाल करें:
Python
from google import genai
client = genai.Client(api_key="GEMINI_API_KEY")
result = client.models.embed_content(
model="text-embedding-004",
contents="What is the meaning of life?")
print(result.embeddings)
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
curl
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
शुरू करें
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
उपयोग के उदाहरण
टेक्स्ट एम्बेड का इस्तेमाल, एआई के कई सामान्य इस्तेमाल के उदाहरणों में किया जाता है. जैसे:
जानकारी हासिल करना: किसी इनपुट टेक्स्ट के हिसाब से, मिलते-जुलते टेक्स्ट को हासिल करने के लिए एम्बेड का इस्तेमाल किया जा सकता है.
क्लस्टरिंग: एम्बेड किए गए डेटा के ग्रुप की तुलना करने से, छिपे हुए रुझानों की पहचान करने में मदद मिल सकती है.
वेक्टर डेटाबेस: एम्बेड करने के अलग-अलग इस्तेमाल के उदाहरणों को प्रोडक्शन में इस्तेमाल करने पर, आम तौर पर एम्बेड को वेक्टर डेटाबेस में सेव किया जाता है.
कैटगरी तय करना: दस्तावेज़ों को कैटगरी में बांटने के लिए, एम्बेड का इस्तेमाल करके मॉडल को ट्रेन किया जा सकता है.
मॉडल एम्बेड करना
Gemini API, टेक्स्ट एम्बेड जनरेट करने वाले तीन मॉडल उपलब्ध कराता है:
हमें उम्मीद है कि आने वाले महीनों में, हम Gemini एम्बेडिंग मॉडल के अपडेट किए गए वर्शन रिलीज़ करेंगे.