text-embedding-004
মডেলটি শব্দ, বাক্যাংশ এবং বাক্যের জন্য অত্যাধুনিক এম্বেডিং তৈরি করে। ফলস্বরূপ এমবেডিংগুলি অন্যান্য অনেকের মধ্যে শব্দার্থিক অনুসন্ধান, পাঠ্য শ্রেণিবিন্যাস এবং ক্লাস্টারিংয়ের মতো কাজের জন্য ব্যবহার করা যেতে পারে। এমবেডিং সম্পর্কে আরও তথ্যের জন্য, আমাদের গবেষণাপত্র পড়ুন।
এমবেডিং কি?
এম্বেডিং শব্দার্থগত অর্থ এবং প্রসঙ্গ ক্যাপচার করে, যার ফলস্বরূপ একই অর্থের সাথে "ঘনিষ্ঠ" এম্বেডিং থাকা পাঠ্য। উদাহরণ স্বরূপ, "আমি আমার কুকুরকে পশুচিকিত্সকের কাছে নিয়ে গিয়েছিলাম" এবং "আমি আমার বিড়ালকে পশুচিকিত্সকের কাছে নিয়ে গিয়েছিলাম" বাক্যটিতে ভেক্টর স্পেসে একে অপরের কাছাকাছি এম্বেডিং থাকবে কারণ তারা উভয়ই একই প্রসঙ্গ বর্ণনা করে।
আপনি বিভিন্ন পাঠ্যের তুলনা করতে এবং তারা কীভাবে সম্পর্কিত তা বুঝতে এম্বেডিং ব্যবহার করতে পারেন। উদাহরণস্বরূপ, যদি "বিড়াল" এবং "কুকুর" পাঠ্যের এম্বেডিংগুলি একসাথে থাকে তবে আপনি অনুমান করতে পারেন যে এই শব্দগুলি অর্থ, প্রসঙ্গে বা উভয় ক্ষেত্রেই একই রকম৷ এটি বিভিন্ন সাধারণ AI ব্যবহারের ক্ষেত্রে সক্ষম করে।
এম্বেডিং তৈরি করুন
টেক্সট এম্বেডিং তৈরি করতে embedContent
পদ্ধতি ব্যবহার করুন:
পাইথন
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
কার্ল
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
যাও
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
কেস ব্যবহার করুন
টেক্সট এম্বেডিংগুলি বিভিন্ন সাধারণ AI ব্যবহারের ক্ষেত্রে ব্যবহৃত হয়, যেমন:
তথ্য পুনরুদ্ধার: ইনপুট পাঠ্যের একটি অংশ দেওয়া শব্দার্থকভাবে অনুরূপ পাঠ পুনরুদ্ধার করতে আপনি এম্বেডিং ব্যবহার করতে পারেন।
ক্লাস্টারিং: এম্বেডিংয়ের গ্রুপগুলির তুলনা করা লুকানো প্রবণতা সনাক্ত করতে সাহায্য করতে পারে।
ক্লাস্টারিং টিউটোরিয়াল এমবেড করা
ভেক্টর ডাটাবেস: আপনি যেহেতু বিভিন্ন এম্বেডিং ব্যবহারের ক্ষেত্রে উৎপাদনে নিয়ে যান, এটি একটি ভেক্টর ডাটাবেসে এম্বেডিং সংরক্ষণ করা সাধারণ।
শ্রেণীবিভাগ: দস্তাবেজগুলিকে বিভাগগুলিতে শ্রেণীবদ্ধ করতে আপনি এমবেডিং ব্যবহার করে একটি মডেলকে প্রশিক্ষণ দিতে পারেন।
মিথুন এম্বেডিং মডেল
Gemini API দুটি মডেল অফার করে যা পাঠ্য এম্বেডিং তৈরি করে:
টেক্সট এমবেডিংস হল এমবেডিং মডেলের একটি আপডেটেড সংস্করণ যা 768 মাত্রার নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ইলাস্টিক এম্বেডিংগুলি ছোট আউটপুট মাত্রা তৈরি করে এবং ছোট কার্যক্ষমতা হ্রাসের সাথে সম্ভাব্য কম্পিউটিং এবং স্টোরেজ খরচ বাঁচায়।
নতুন প্রকল্প বা অ্যাপ্লিকেশনের জন্য টেক্সট এম্বেডিং ব্যবহার করুন।
, text-embedding-004
মডেলটি শব্দ, বাক্যাংশ এবং বাক্যের জন্য অত্যাধুনিক এম্বেডিং তৈরি করে। ফলস্বরূপ এমবেডিংগুলি অন্যান্য অনেকের মধ্যে শব্দার্থিক অনুসন্ধান, পাঠ্য শ্রেণিবিন্যাস এবং ক্লাস্টারিংয়ের মতো কাজের জন্য ব্যবহার করা যেতে পারে। এমবেডিং সম্পর্কে আরও তথ্যের জন্য, আমাদের গবেষণাপত্র পড়ুন।
এমবেডিং কি?
এম্বেডিং শব্দার্থগত অর্থ এবং প্রসঙ্গ ক্যাপচার করে, যার ফলস্বরূপ একই অর্থের সাথে "ঘনিষ্ঠ" এম্বেডিং থাকা পাঠ্য। উদাহরণ স্বরূপ, "আমি আমার কুকুরকে পশুচিকিত্সকের কাছে নিয়ে গিয়েছিলাম" এবং "আমি আমার বিড়ালকে পশুচিকিত্সকের কাছে নিয়ে গিয়েছিলাম" বাক্যটিতে ভেক্টর স্পেসে একে অপরের কাছাকাছি এম্বেডিং থাকবে কারণ তারা উভয়ই একই প্রসঙ্গ বর্ণনা করে।
আপনি বিভিন্ন পাঠ্যের তুলনা করতে এবং তারা কীভাবে সম্পর্কিত তা বুঝতে এম্বেডিং ব্যবহার করতে পারেন। উদাহরণস্বরূপ, যদি "বিড়াল" এবং "কুকুর" পাঠ্যের এম্বেডিংগুলি একসাথে থাকে তবে আপনি অনুমান করতে পারেন যে এই শব্দগুলি অর্থ, প্রসঙ্গে বা উভয় ক্ষেত্রেই একই রকম৷ এটি বিভিন্ন সাধারণ AI ব্যবহারের ক্ষেত্রে সক্ষম করে।
এম্বেডিং তৈরি করুন
টেক্সট এম্বেডিং তৈরি করতে embedContent
পদ্ধতি ব্যবহার করুন:
পাইথন
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
কার্ল
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
যাও
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
কেস ব্যবহার করুন
টেক্সট এম্বেডিংগুলি বিভিন্ন সাধারণ AI ব্যবহারের ক্ষেত্রে ব্যবহৃত হয়, যেমন:
তথ্য পুনরুদ্ধার: ইনপুট পাঠ্যের একটি অংশ দেওয়া শব্দার্থকভাবে অনুরূপ পাঠ পুনরুদ্ধার করতে আপনি এম্বেডিং ব্যবহার করতে পারেন।
ক্লাস্টারিং: এম্বেডিংয়ের গ্রুপগুলির তুলনা করা লুকানো প্রবণতা সনাক্ত করতে সাহায্য করতে পারে।
ক্লাস্টারিং টিউটোরিয়াল এমবেড করা
ভেক্টর ডাটাবেস: আপনি যেহেতু বিভিন্ন এম্বেডিং ব্যবহারের ক্ষেত্রে উৎপাদনে নিয়ে যান, এটি একটি ভেক্টর ডাটাবেসে এম্বেডিং সংরক্ষণ করা সাধারণ।
শ্রেণীবিভাগ: দস্তাবেজগুলিকে বিভাগগুলিতে শ্রেণীবদ্ধ করতে আপনি এমবেডিং ব্যবহার করে একটি মডেলকে প্রশিক্ষণ দিতে পারেন।
মিথুন এম্বেডিং মডেল
Gemini API দুটি মডেল অফার করে যা পাঠ্য এম্বেডিং তৈরি করে:
টেক্সট এমবেডিংস হল এমবেডিং মডেলের একটি আপডেটেড সংস্করণ যা 768 মাত্রার নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ইলাস্টিক এম্বেডিংগুলি ছোট আউটপুট মাত্রা তৈরি করে এবং ছোট কার্যক্ষমতা হ্রাসের সাথে সম্ভাব্য কম্পিউটিং এবং স্টোরেজ খরচ বাঁচায়।
নতুন প্রকল্প বা অ্যাপ্লিকেশনের জন্য টেক্সট এম্বেডিং ব্যবহার করুন।