Modeli text-embedding-004
gjeneron ngulitje më të fundit për fjalë, fraza dhe fjali. Përfshirjet që rezultojnë mund të përdoren më pas për detyra të tilla si kërkimi semantik, klasifikimi i tekstit dhe grupimi, ndër shumë të tjera. Për më shumë informacion mbi futjet, lexoni punimin tonë kërkimor .
Çfarë janë embeddings?
Embeddings kapin kuptimin dhe kontekstin semantik, gjë që rezulton në tekst me kuptime të ngjashme që kanë ngulitje "më të afërta". Për shembull, fjalia "E çova qenin tim te veterineri" dhe "Unë e çova macen time te veterineri" do të kishte ngulitje që janë afër njëra-tjetrës në hapësirën vektoriale pasi që të dy përshkruajnë një kontekst të ngjashëm.
Ju mund të përdorni embeddings për të krahasuar tekste të ndryshme dhe për të kuptuar se si ato lidhen. Për shembull, nëse futjet e tekstit "mace" dhe "qen" janë afër njëra-tjetrës, mund të konkludoni se këto fjalë janë të ngjashme në kuptim, kontekst ose të dyja. Kjo mundëson një sërë rastesh të zakonshme të përdorimit të AI .
Gjeneroni ngulitje
Përdorni metodën embedContent
për të gjeneruar ngulitje teksti:
Python
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Nyja.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
kaçurrela
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
Shkoni
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
Rastet e përdorimit
Përfshirjet e tekstit përdoren në një sërë rastesh të zakonshme të përdorimit të AI, të tilla si:
Marrja e informacionit: Ju mund të përdorni ngulitje për të marrë tekst të ngjashëm semantikisht të dhënë një pjesë të tekstit hyrës.
Grumbullimi: Krahasimi i grupeve të përfshirjeve mund të ndihmojë në identifikimin e tendencave të fshehura.
Baza e të dhënave vektoriale: Ndërsa merrni raste të ndryshme të përdorimit të ngulitjes në prodhim, është e zakonshme të ruash futjet në një bazë të dhënash vektoriale.
Klasifikimi: Ju mund të trajnoni një model duke përdorur ngulitje për të klasifikuar dokumentet në kategori.
Modelet e ngulitjes së Binjakëve
Gemini API ofron dy modele që gjenerojnë ngulitje teksti:
Text Embeddings është një version i përditësuar i modelit Embedding që ofron madhësi elastike të futjes nën 768 dimensione. Mbështjelljet elastike gjenerojnë dimensione më të vogla të prodhimit dhe potencialisht kursejnë kostot e llogaritjes dhe ruajtjes me humbje të vogla të performancës.
Përdorni Embeddings Teksti për projekte ose aplikacione të reja.