جاسازی ها در Gemini API

مدل text-embedding-004 جاسازی های پیشرفته ای را برای کلمات، عبارات و جملات ایجاد می کند. تعبیه‌های به‌دست‌آمده می‌توانند برای کارهایی مانند جستجوی معنایی، طبقه‌بندی متن، و خوشه‌بندی و بسیاری دیگر استفاده شوند. برای اطلاعات بیشتر در مورد جاسازی، مقاله تحقیقاتی ما را بخوانید.

تعبیه ها چیست؟

تعبیه‌ها معنا و زمینه معنایی را در بر می‌گیرند که در نتیجه متنی با معانی مشابه دارای تعبیه‌های «نزدیک‌تر» است. به عنوان مثال، جمله "من سگم را به دامپزشک بردم" و "گربه ام را به دامپزشک بردم" دارای جاسازی هایی هستند که در فضای برداری نزدیک به یکدیگر هستند زیرا هر دو زمینه مشابهی را توصیف می کنند.

می توانید از جاسازی ها برای مقایسه متون مختلف و درک نحوه ارتباط آنها استفاده کنید. به عنوان مثال، اگر تعبیه‌های متن «گربه» و «سگ» نزدیک به هم باشند، می‌توانید استنباط کنید که این کلمات از نظر معنا، بافت یا هر دو مشابه هستند. این امکان انواع موارد استفاده رایج از هوش مصنوعی را فراهم می کند.

جاسازی ها را ایجاد کنید

برای ایجاد جاسازی متن از روش embedContent استفاده کنید:

پایتون

import google.generativeai as genai
import os

genai.configure(api_key=os.environ["GEMINI_API_KEY"])

result = genai.embed_content(
        model="models/text-embedding-004",
        content="What is the meaning of life?")

print(str(result['embedding']))

Node.js

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});

async function run() {
    const result = await model.embedContent("What is the meaning of life?");
    console.log(result.embedding.values);
}

run();

حلقه کردن

curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
     "content": {
     "parts":[{
     "text": "What is the meaning of life?"}]}
    }'

برو

ctx := context.Background()

client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
    log.Fatal(err)
}
defer client.Close()

em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))

if err != nil {
    panic(err)
}
fmt.Println(res.Embedding.Values)

موارد استفاده کنید

تعبیه‌های متن در انواع موارد رایج استفاده از هوش مصنوعی استفاده می‌شوند، مانند:

  • بازیابی اطلاعات: می‌توانید از جاسازی‌ها برای بازیابی متنی مشابه از نظر معنایی با توجه به یک متن ورودی استفاده کنید.

    آموزش جستجوی سند

  • خوشه‌بندی: مقایسه گروه‌های جاسازی‌ها می‌تواند به شناسایی روندهای پنهان کمک کند.

    آموزش جاسازی خوشه بندی

  • پایگاه داده برداری: از آنجایی که موارد مختلف استفاده از جاسازی را برای تولید می گیرید، ذخیره سازی جاسازی ها در یک پایگاه داده برداری معمول است.

    وکتور آموزش پایگاه داده

  • طبقه بندی: می توانید یک مدل را با استفاده از جاسازی ها برای طبقه بندی اسناد به دسته ها آموزش دهید.

    آموزشی طبقه بندی

مدل های جاسازی جمینی

Gemini API دو مدل برای ایجاد جاسازی متن ارائه می دهد:

Text Embeddings یک نسخه به روز شده از مدل Embedding است که اندازه های جاسازی الاستیک را زیر 768 ابعاد ارائه می دهد. تعبیه‌های الاستیک ابعاد خروجی کوچک‌تری ایجاد می‌کنند و به طور بالقوه در هزینه‌های محاسباتی و ذخیره‌سازی با کاهش عملکرد جزئی صرفه‌جویی می‌کنند.

از Text Embedding برای پروژه ها یا برنامه های جدید استفاده کنید.

،

مدل text-embedding-004 جاسازی های پیشرفته ای را برای کلمات، عبارات و جملات ایجاد می کند. تعبیه‌های به‌دست‌آمده می‌توانند برای کارهایی مانند جستجوی معنایی، طبقه‌بندی متن، و خوشه‌بندی و بسیاری دیگر استفاده شوند. برای اطلاعات بیشتر در مورد جاسازی، مقاله تحقیقاتی ما را بخوانید.

تعبیه ها چیست؟

تعبیه‌ها معنا و زمینه معنایی را در بر می‌گیرند که در نتیجه متنی با معانی مشابه دارای تعبیه‌های «نزدیک‌تر» است. به عنوان مثال، جمله "من سگم را به دامپزشک بردم" و "گربه ام را به دامپزشک بردم" دارای جاسازی هایی هستند که در فضای برداری نزدیک به یکدیگر هستند زیرا هر دو زمینه مشابهی را توصیف می کنند.

می توانید از جاسازی ها برای مقایسه متون مختلف و درک نحوه ارتباط آنها استفاده کنید. به عنوان مثال، اگر تعبیه‌های متن «گربه» و «سگ» نزدیک به هم باشند، می‌توانید استنباط کنید که این کلمات از نظر معنا، بافت یا هر دو مشابه هستند. این امکان انواع موارد استفاده رایج از هوش مصنوعی را فراهم می کند.

جاسازی ها را ایجاد کنید

برای ایجاد جاسازی متن از روش embedContent استفاده کنید:

پایتون

import google.generativeai as genai
import os

genai.configure(api_key=os.environ["GEMINI_API_KEY"])

result = genai.embed_content(
        model="models/text-embedding-004",
        content="What is the meaning of life?")

print(str(result['embedding']))

Node.js

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});

async function run() {
    const result = await model.embedContent("What is the meaning of life?");
    console.log(result.embedding.values);
}

run();

حلقه کردن

curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
     "content": {
     "parts":[{
     "text": "What is the meaning of life?"}]}
    }'

برو

ctx := context.Background()

client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
    log.Fatal(err)
}
defer client.Close()

em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))

if err != nil {
    panic(err)
}
fmt.Println(res.Embedding.Values)

موارد استفاده کنید

تعبیه‌های متن در انواع موارد رایج استفاده از هوش مصنوعی استفاده می‌شوند، مانند:

  • بازیابی اطلاعات: می‌توانید از جاسازی‌ها برای بازیابی متنی مشابه از نظر معنایی با توجه به یک متن ورودی استفاده کنید.

    آموزش جستجوی سند

  • خوشه‌بندی: مقایسه گروه‌های جاسازی‌ها می‌تواند به شناسایی روندهای پنهان کمک کند.

    آموزش جاسازی خوشه بندی

  • پایگاه داده برداری: از آنجایی که موارد مختلف استفاده از جاسازی را برای تولید می گیرید، ذخیره سازی جاسازی ها در یک پایگاه داده برداری معمول است.

    وکتور آموزش پایگاه داده

  • طبقه بندی: می توانید یک مدل را با استفاده از جاسازی ها برای طبقه بندی اسناد به دسته ها آموزش دهید.

    آموزشی طبقه بندی

مدل های جاسازی جمینی

Gemini API دو مدل برای ایجاد جاسازی متن ارائه می دهد:

Text Embeddings یک نسخه به روز شده از مدل Embedding است که اندازه های جاسازی الاستیک را زیر 768 ابعاد ارائه می دهد. تعبیه‌های الاستیک ابعاد خروجی کوچک‌تری ایجاد می‌کنند و به طور بالقوه در هزینه‌های محاسباتی و ذخیره‌سازی با کاهش عملکرد جزئی صرفه‌جویی می‌کنند.

از Text Embedding برای پروژه ها یا برنامه های جدید استفاده کنید.