text-embedding-004
मॉडल, शब्दों, वाक्यांशों, और वाक्यों के लिए सबसे आधुनिक एम्बेड जनरेट करता है. इसके बाद, इन एम्बेड का इस्तेमाल कई कामों के लिए किया जा सकता है. जैसे, सेमैनटिक सर्च, टेक्स्ट का क्लासिफ़िकेशन, और क्लस्टरिंग वगैरह. एम्बेड करने के बारे में ज़्यादा जानकारी के लिए, हमारा रिसर्च पेपर पढ़ें.
एम्बेड क्या होते हैं?
एम्बेडमेंट, सेमैनटिक मतलब और संदर्भ को कैप्चर करते हैं. इससे, मिलते-जुलते मतलब वाले टेक्स्ट में "ज़्यादा" एम्बेडमेंट होते हैं. उदाहरण के लिए, "मैंने अपने कुत्ते को डॉक्टर के पास ले गया" और "मैंने अपनी बिल्ली को डॉक्टर के पास ले गया" वाक्यों के एम्बेड, वेक्टर स्पेस में एक-दूसरे के करीब होंगे, क्योंकि दोनों वाक्यों में एक जैसा कॉन्टेक्स्ट है.
अलग-अलग टेक्स्ट की तुलना करने और यह समझने के लिए कि वे एक-दूसरे से कैसे जुड़े हैं, एम्बेड का इस्तेमाल किया जा सकता है. उदाहरण के लिए, अगर टेक्स्ट "बिल्ली" और "कुत्ता" के एम्बेड एक-दूसरे के करीब हैं, तो इससे यह अनुमान लगाया जा सकता है कि ये शब्द मतलब, संदर्भ या दोनों में मिलते-जुलते हैं. इससे, एआई के सामान्य इस्तेमाल के उदाहरण की संख्या बढ़ जाती है.
एम्बेड जनरेट करना
टेक्स्ट एम्बेड जनरेट करने के लिए, embedContent
तरीके का इस्तेमाल करें:
Python
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
curl
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
शुरू करें
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
उपयोग के उदाहरण
टेक्स्ट एम्बेड का इस्तेमाल, एआई के कई सामान्य इस्तेमाल के उदाहरणों में किया जाता है. जैसे:
जानकारी हासिल करना: किसी इनपुट टेक्स्ट के हिसाब से, मिलते-जुलते टेक्स्ट को हासिल करने के लिए एम्बेड का इस्तेमाल किया जा सकता है.
क्लस्टरिंग: एम्बेड किए गए डेटा के ग्रुप की तुलना करने से, छिपे हुए रुझानों की पहचान करने में मदद मिल सकती है.
वेक्टर डेटाबेस: एम्बेड करने के अलग-अलग इस्तेमाल के उदाहरणों को प्रोडक्शन में ले जाने पर, आम तौर पर एम्बेड को वेक्टर डेटाबेस में सेव किया जाता है.
वर्गीकरण: दस्तावेज़ों को कैटगरी में बांटने के लिए, एम्बेड का इस्तेमाल करके मॉडल को ट्रेन किया जा सकता है.
Gemini के एम्बेडिंग मॉडल
Gemini API, टेक्स्ट एम्बेड जनरेट करने वाले दो मॉडल उपलब्ध कराता है:
टेक्स्ट एम्बेडिंग, एम्बेडिंग मॉडल का अपडेट किया गया वर्शन है. यह 768 डाइमेंशन के नीचे, एम्बेडिंग के लिए ज़रूरत के मुताबिक साइज़ उपलब्ध कराता है. इलास्टिक एम्बेडमेंट, छोटे आउटपुट डाइमेंशन जनरेट करते हैं. साथ ही, परफ़ॉर्मेंस में थोड़ी गिरावट के साथ, कंप्यूटिंग और स्टोरेज की लागत को कम करते हैं.
नए प्रोजेक्ट या ऐप्लिकेशन के लिए, टेक्स्ट एम्बेड करने की सुविधा का इस्तेमाल करें.