مدل text-embedding-004
جاسازی های پیشرفته ای را برای کلمات، عبارات و جملات ایجاد می کند. تعبیههای بهدستآمده میتوانند برای کارهایی مانند جستجوی معنایی، طبقهبندی متن، و خوشهبندی و بسیاری دیگر استفاده شوند. برای اطلاعات بیشتر در مورد جاسازی، مقاله تحقیقاتی ما را بخوانید.
تعبیه ها چیست؟
تعبیهها معنا و زمینه معنایی را در بر میگیرند که در نتیجه متنی با معانی مشابه دارای تعبیههای «نزدیکتر» است. به عنوان مثال، جمله "من سگم را به دامپزشک بردم" و "گربه ام را به دامپزشک بردم" دارای جاسازی هایی هستند که در فضای برداری نزدیک به یکدیگر هستند زیرا هر دو زمینه مشابهی را توصیف می کنند.
می توانید از جاسازی ها برای مقایسه متون مختلف و درک نحوه ارتباط آنها استفاده کنید. به عنوان مثال، اگر تعبیههای متن «گربه» و «سگ» نزدیک به هم باشند، میتوانید استنباط کنید که این کلمات از نظر معنا، بافت یا هر دو مشابه هستند. این امکان انواع موارد استفاده رایج از هوش مصنوعی را فراهم می کند.
جاسازی ها را ایجاد کنید
برای ایجاد جاسازی متن از روش embedContent
استفاده کنید:
پایتون
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
حلقه کردن
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
برو
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
موارد استفاده کنید
تعبیههای متن در انواع موارد رایج استفاده از هوش مصنوعی استفاده میشوند، مانند:
بازیابی اطلاعات: میتوانید از جاسازیها برای بازیابی متنی مشابه از نظر معنایی با توجه به یک متن ورودی استفاده کنید.
خوشهبندی: مقایسه گروههای جاسازیها میتواند به شناسایی روندهای پنهان کمک کند.
پایگاه داده برداری: از آنجایی که موارد مختلف استفاده از جاسازی را برای تولید می گیرید، ذخیره سازی جاسازی ها در یک پایگاه داده برداری معمول است.
وکتور آموزش پایگاه داده
طبقه بندی: می توانید یک مدل را با استفاده از جاسازی ها برای طبقه بندی اسناد به دسته ها آموزش دهید.
مدل های جاسازی جمینی
Gemini API دو مدل برای ایجاد جاسازی متن ارائه می دهد:
Text Embeddings یک نسخه به روز شده از مدل Embedding است که اندازه های جاسازی الاستیک را زیر 768 ابعاد ارائه می دهد. تعبیههای الاستیک ابعاد خروجی کوچکتری ایجاد میکنند و به طور بالقوه در هزینههای محاسباتی و ذخیرهسازی با کاهش عملکرد جزئی صرفهجویی میکنند.
از Text Embedding برای پروژه ها یا برنامه های جدید استفاده کنید.
، مدل text-embedding-004
جاسازی های پیشرفته ای را برای کلمات، عبارات و جملات ایجاد می کند. تعبیههای بهدستآمده میتوانند برای کارهایی مانند جستجوی معنایی، طبقهبندی متن، و خوشهبندی و بسیاری دیگر استفاده شوند. برای اطلاعات بیشتر در مورد جاسازی، مقاله تحقیقاتی ما را بخوانید.
تعبیه ها چیست؟
تعبیهها معنا و زمینه معنایی را در بر میگیرند که در نتیجه متنی با معانی مشابه دارای تعبیههای «نزدیکتر» است. به عنوان مثال، جمله "من سگم را به دامپزشک بردم" و "گربه ام را به دامپزشک بردم" دارای جاسازی هایی هستند که در فضای برداری نزدیک به یکدیگر هستند زیرا هر دو زمینه مشابهی را توصیف می کنند.
می توانید از جاسازی ها برای مقایسه متون مختلف و درک نحوه ارتباط آنها استفاده کنید. به عنوان مثال، اگر تعبیههای متن «گربه» و «سگ» نزدیک به هم باشند، میتوانید استنباط کنید که این کلمات از نظر معنا، بافت یا هر دو مشابه هستند. این امکان انواع موارد استفاده رایج از هوش مصنوعی را فراهم می کند.
جاسازی ها را ایجاد کنید
برای ایجاد جاسازی متن از روش embedContent
استفاده کنید:
پایتون
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
حلقه کردن
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
برو
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
موارد استفاده کنید
تعبیههای متن در انواع موارد رایج استفاده از هوش مصنوعی استفاده میشوند، مانند:
بازیابی اطلاعات: میتوانید از جاسازیها برای بازیابی متنی مشابه از نظر معنایی با توجه به یک متن ورودی استفاده کنید.
خوشهبندی: مقایسه گروههای جاسازیها میتواند به شناسایی روندهای پنهان کمک کند.
پایگاه داده برداری: از آنجایی که موارد مختلف استفاده از جاسازی را برای تولید می گیرید، ذخیره سازی جاسازی ها در یک پایگاه داده برداری معمول است.
وکتور آموزش پایگاه داده
طبقه بندی: می توانید یک مدل را با استفاده از جاسازی ها برای طبقه بندی اسناد به دسته ها آموزش دهید.
مدل های جاسازی جمینی
Gemini API دو مدل برای ایجاد جاسازی متن ارائه می دهد:
Text Embeddings یک نسخه به روز شده از مدل Embedding است که اندازه های جاسازی الاستیک را زیر 768 ابعاد ارائه می دهد. تعبیههای الاستیک ابعاد خروجی کوچکتری ایجاد میکنند و به طور بالقوه در هزینههای محاسباتی و ذخیرهسازی با کاهش عملکرد جزئی صرفهجویی میکنند.
از Text Embedding برای پروژه ها یا برنامه های جدید استفاده کنید.