এমবেডিং হল টেক্সট ইনপুটের একটি সংখ্যাগত উপস্থাপনা যা অনেকগুলি অনন্য ব্যবহারের ক্ষেত্রে উন্মুক্ত করে, যেমন ক্লাস্টারিং, সাদৃশ্য পরিমাপ এবং তথ্য পুনরুদ্ধার। একটি ভূমিকার জন্য, এম্বেডিং গাইড দেখুন।
নতুন বিষয়বস্তু তৈরি করে এমন জেনারেটিভ এআই মডেলের বিপরীতে, জেমিনি এম্বেডিং মডেলটি শুধুমাত্র আপনার ইনপুট ডেটার বিন্যাসকে একটি সংখ্যাসূচক উপস্থাপনায় রূপান্তরিত করার উদ্দেশ্যে তৈরি করা হয়েছে। যদিও Google একটি এমবেডিং মডেল প্রদানের জন্য দায়ী যা আপনার ইনপুট ডেটার বিন্যাসকে অনুরোধ করা সংখ্যাসূচক-ফরম্যাটে রূপান্তর করে, ব্যবহারকারীরা তাদের ইনপুট করা ডেটা এবং ফলস্বরূপ এমবেডিংয়ের সম্পূর্ণ দায়বদ্ধতা বজায় রাখে। জেমিনি এম্বেডিং মডেল ব্যবহার করে আপনি নিশ্চিত করেন যে আপনার আপলোড করা যেকোনো বিষয়বস্তুর প্রয়োজনীয় অধিকার রয়েছে। অন্যের মেধা সম্পত্তি বা গোপনীয়তার অধিকার লঙ্ঘন করে এমন সামগ্রী তৈরি করবেন না। আপনার এই পরিষেবার ব্যবহার আমাদের নিষিদ্ধ ব্যবহারের নীতি এবং Google-এর পরিষেবার শর্তাবলীর সাপেক্ষে৷
পদ্ধতি: models.embedContent
নির্দিষ্ট জেমিনি এম্বেডিং মডেল ব্যবহার করে ইনপুট Content থেকে একটি পাঠ্য এম্বেডিং ভেক্টর তৈরি করে৷
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:embedContentপাথ প্যারামিটার
modelstringপ্রয়োজন। মডেলের সম্পদের নাম। এটি মডেল ব্যবহার করার জন্য একটি আইডি হিসাবে কাজ করে।
এই নামটি models.list পদ্ধতি দ্বারা প্রত্যাবর্তিত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model} এটি ফর্ম models/{model} লাগে।
শরীরের অনুরোধ
অনুরোধের অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
contentobject ( Content ) প্রয়োজন। এম্বেড করার বিষয়বস্তু। শুধুমাত্র parts.text ক্ষেত্র গণনা করা হবে।
taskTypeenum ( TaskType ) ঐচ্ছিক। ঐচ্ছিক টাস্ক টাইপ যার জন্য এম্বেডিং ব্যবহার করা হবে। আগের মডেলগুলিতে সমর্থিত নয় ( models/embedding-001 )।
titlestring ঐচ্ছিক। পাঠ্যের জন্য একটি ঐচ্ছিক শিরোনাম। শুধুমাত্র টাস্কটাইপ RETRIEVAL_DOCUMENT হলেই প্রযোজ্য।
দ্রষ্টব্য: RETRIEVAL_DOCUMENT এর জন্য একটি title নির্দিষ্ট করা পুনরুদ্ধারের জন্য আরও ভাল মানের এম্বেডিং প্রদান করে৷
outputDimensionalityinteger ঐচ্ছিক। আউটপুট এম্বেডিংয়ের জন্য ঐচ্ছিক হ্রাস মাত্রা। যদি সেট করা থাকে, আউটপুট এম্বেডিংয়ের অতিরিক্ত মান শেষ থেকে কেটে ফেলা হয়। শুধুমাত্র 2024 সাল থেকে নতুন মডেল দ্বারা সমর্থিত। পূর্ববর্তী মডেল ব্যবহার করলে আপনি এই মান সেট করতে পারবেন না ( models/embedding-001 )।
উদাহরণ অনুরোধ
পাইথন
Node.js
যাও
শেল
প্রতিক্রিয়া শরীর
সফল হলে, প্রতিক্রিয়া বডিতে EmbedContentResponse এর একটি উদাহরণ থাকে।
পদ্ধতি: models.batchEmbedContents
ইনপুট Content থেকে একাধিক এম্বেডিং ভেক্টর তৈরি করে যা EmbedContentRequest অবজেক্ট হিসাবে উপস্থাপিত স্ট্রিংগুলির একটি ব্যাচ নিয়ে গঠিত।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:batchEmbedContentsপাথ প্যারামিটার
modelstringপ্রয়োজন। মডেলের সম্পদের নাম। এটি মডেল ব্যবহার করার জন্য একটি আইডি হিসাবে কাজ করে।
এই নামটি models.list পদ্ধতি দ্বারা প্রত্যাবর্তিত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model} এটি ফর্ম models/{model} লাগে।
শরীরের অনুরোধ
অনুরোধের অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
requests[]object ( EmbedContentRequest ) প্রয়োজন। ব্যাচের জন্য এম্বেড অনুরোধ. এই প্রতিটি অনুরোধের মডেলটি অবশ্যই নির্দিষ্ট BatchEmbedContentsRequest.model মডেলের সাথে মিলবে।
উদাহরণ অনুরোধ
পাইথন
Node.js
যাও
শেল
প্রতিক্রিয়া শরীর
একটি BatchEmbedContentsRequest এর প্রতিক্রিয়া।
সফল হলে, প্রতিক্রিয়া বডিতে নিম্নলিখিত কাঠামোর সাথে ডেটা থাকে:
embeddings[]object ( ContentEmbedding )শুধুমাত্র আউটপুট। প্রতিটি অনুরোধের জন্য এমবেডিং, ব্যাচ অনুরোধে দেওয়া একই ক্রমে।
| JSON প্রতিনিধিত্ব |
|---|
{
"embeddings": [
{
object ( |
পদ্ধতি: models.asyncBatchEmbedContent
ব্যাচ প্রক্রিয়াকরণের জন্য models.embedContent অনুরোধের একটি ব্যাচ সারিবদ্ধ করে। GenerativeService এ আমাদের একটি models.batchEmbedContents হ্যান্ডলার আছে, কিন্তু এটি সিঙ্ক্রোনাইজ করা হয়েছে। তাই আমরা বিভ্রান্তি এড়াতে এটির নাম Async রাখি।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{batch.model=models /*}:asyncBatchEmbedContentপাথ প্যারামিটার
batch.modelstring প্রয়োজন। সমাপ্তি তৈরি করার জন্য ব্যবহার করা Model নাম।
বিন্যাস: models/{model} । এটি ফর্ম models/{model} লাগে।
শরীরের অনুরোধ
অনুরোধের অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
batch.namestringশুধুমাত্র আউটপুট। শনাক্তকারী। ব্যাচের সম্পদের নাম।
বিন্যাস: batches/{batchId} ।
batch.displayNamestringপ্রয়োজন। এই ব্যাচের ব্যবহারকারী-সংজ্ঞায়িত নাম।
batch.inputConfigobject ( InputEmbedContentConfig )প্রয়োজন। ইনপুট কনফিগারেশন যেখানে ব্যাচ প্রক্রিয়াকরণ সঞ্চালিত হয়.
batch.outputobject ( EmbedContentBatchOutput )শুধুমাত্র আউটপুট। ব্যাচের অনুরোধের আউটপুট।
batch.createTimestring ( Timestamp format)শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ তৈরি হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" বা "2014-10-02T15:01:23+05:30"
batch.endTimestring ( Timestamp format)শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ প্রক্রিয়াকরণ সম্পন্ন হয়েছে।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" বা "2014-10-02T15:01:23+05:30"
batch.updateTimestring ( Timestamp format)শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ শেষ আপডেট করা হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" বা "2014-10-02T15:01:23+05:30"
batch.batchStatsobject ( EmbedContentBatchStats )শুধুমাত্র আউটপুট। ব্যাচ সম্পর্কে পরিসংখ্যান.
batch.stateenum ( BatchState )শুধুমাত্র আউটপুট। ব্যাচের অবস্থা।
batch.prioritystring ( int64 format)ঐচ্ছিক। ব্যাচের অগ্রাধিকার। একটি উচ্চ অগ্রাধিকার মান সঙ্গে ব্যাচ একটি নিম্ন অগ্রাধিকার মান সঙ্গে ব্যাচ আগে প্রক্রিয়া করা হবে. নেতিবাচক মান অনুমোদিত. ডিফল্ট 0।
প্রতিক্রিয়া শরীর
সফল হলে, প্রতিক্রিয়া বডিতে Operation একটি উদাহরণ থাকে।
EmbedContentResponse
একটি EmbedContentRequest এর প্রতিক্রিয়া।
embeddingobject ( ContentEmbedding )শুধুমাত্র আউটপুট। ইনপুট বিষয়বস্তু থেকে উৎপন্ন এমবেডিং।
| JSON প্রতিনিধিত্ব |
|---|
{
"embedding": {
object ( |
কন্টেন্ট এম্বেডিং
একটি এমবেডিং প্রতিনিধিত্বকারী ফ্লোটগুলির একটি তালিকা৷
values[]numberএমবেডিং মান.
| JSON প্রতিনিধিত্ব |
|---|
{ "values": [ number ] } |
টাস্ক টাইপ
টাস্কের ধরন যার জন্য এম্বেডিং ব্যবহার করা হবে।
| এনামস | |
|---|---|
TASK_TYPE_UNSPECIFIED | আনসেট মান, যা অন্যান্য enum মানগুলির একটিতে ডিফল্ট হবে। |
RETRIEVAL_QUERY | প্রদত্ত টেক্সট একটি অনুসন্ধান/পুনরুদ্ধার সেটিং একটি ক্যোয়ারী নির্দিষ্ট করে. |
RETRIEVAL_DOCUMENT | প্রদত্ত পাঠ্যটি অনুসন্ধান করা কর্পাস থেকে একটি নথি নির্দিষ্ট করে৷ |
SEMANTIC_SIMILARITY | প্রদত্ত পাঠ্যটি STS-এর জন্য ব্যবহার করা হবে তা নির্দিষ্ট করে। |
CLASSIFICATION | নির্দিষ্ট করে যে প্রদত্ত পাঠ্যটি শ্রেণীবদ্ধ করা হবে। |
CLUSTERING | নির্দিষ্ট করে যে এমবেডিংগুলি ক্লাস্টারিংয়ের জন্য ব্যবহার করা হবে৷ |
QUESTION_ANSWERING | নির্দিষ্ট করে যে প্রদত্ত পাঠ্যটি প্রশ্নের উত্তরের জন্য ব্যবহার করা হবে। |
FACT_VERIFICATION | উল্লেখ করে যে প্রদত্ত পাঠ্য সত্য যাচাইয়ের জন্য ব্যবহার করা হবে। |
CODE_RETRIEVAL_QUERY | নির্দিষ্ট করে যে প্রদত্ত পাঠ্যটি কোড পুনরুদ্ধারের জন্য ব্যবহার করা হবে। |
EmbedContentBatch
- JSON প্রতিনিধিত্ব
- InputEmbedContentConfig
- ইনলাইনড এম্বেড কন্টেন্ট অনুরোধ
- ইনলাইনডএম্বেডকন্টেন্টরিকোয়েস্ট
- EmbedContentBatchOutput
- ইনলাইনড এম্বেড বিষয়বস্তু প্রতিক্রিয়া
- ইনলাইন্ডএম্বেডকন্টেন্ট রেসপন্স
- EmbedContentBatchStats
EmbedContent অনুরোধের একটি ব্যাচের প্রতিনিধিত্বকারী একটি সংস্থান।
modelstring প্রয়োজন। সমাপ্তি তৈরি করার জন্য ব্যবহার করা Model নাম।
বিন্যাস: models/{model} ।
namestringশুধুমাত্র আউটপুট। শনাক্তকারী। ব্যাচের সম্পদের নাম।
বিন্যাস: batches/{batchId} ।
displayNamestringপ্রয়োজন। এই ব্যাচের ব্যবহারকারী-সংজ্ঞায়িত নাম।
inputConfigobject ( InputEmbedContentConfig )প্রয়োজন। ইনপুট কনফিগারেশন যেখানে ব্যাচ প্রক্রিয়াকরণ সঞ্চালিত হয়.
outputobject ( EmbedContentBatchOutput )শুধুমাত্র আউটপুট। ব্যাচের অনুরোধের আউটপুট।
createTimestring ( Timestamp format)শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ তৈরি হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" বা "2014-10-02T15:01:23+05:30"
endTimestring ( Timestamp format)শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ প্রক্রিয়াকরণ সম্পন্ন হয়েছে।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" বা "2014-10-02T15:01:23+05:30"
updateTimestring ( Timestamp format)শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ শেষ আপডেট করা হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" বা "2014-10-02T15:01:23+05:30"
batchStatsobject ( EmbedContentBatchStats )শুধুমাত্র আউটপুট। ব্যাচ সম্পর্কে পরিসংখ্যান.
stateenum ( BatchState )শুধুমাত্র আউটপুট। ব্যাচের অবস্থা।
prioritystring ( int64 format)ঐচ্ছিক। ব্যাচের অগ্রাধিকার। একটি উচ্চ অগ্রাধিকার মান সঙ্গে ব্যাচ একটি নিম্ন অগ্রাধিকার মান সঙ্গে ব্যাচ আগে প্রক্রিয়া করা হবে. নেতিবাচক মান অনুমোদিত. ডিফল্ট 0।
| JSON প্রতিনিধিত্ব |
|---|
{ "model": string, "name": string, "displayName": string, "inputConfig": { object ( |
InputEmbedContentConfig
ব্যাচের অনুরোধে ইনপুট কনফিগার করে।
sourceUnion typesource নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: fileNamestring ইনপুট অনুরোধ ধারণকারী File নাম।
requestsobject ( InlinedEmbedContentRequests )অনুরোধগুলি ব্যাচে প্রক্রিয়াকরণ করা হবে৷
| JSON প্রতিনিধিত্ব |
|---|
{
// source
"fileName": string,
"requests": {
object ( |
ইনলাইনড এম্বেড কন্টেন্ট অনুরোধ
ব্যাচ তৈরির অনুরোধের অংশ হিসাবে প্রদান করা হলে ব্যাচে প্রক্রিয়া করা হবে।
requests[]object ( InlinedEmbedContentRequest )প্রয়োজন। অনুরোধগুলি ব্যাচে প্রক্রিয়াকরণ করা হবে৷
| JSON প্রতিনিধিত্ব |
|---|
{
"requests": [
{
object ( |
ইনলাইনডএম্বেডকন্টেন্টরিকোয়েস্ট
ব্যাচে প্রক্রিয়াকরণের অনুরোধ।
requestobject ( EmbedContentRequest )প্রয়োজন। ব্যাচে প্রক্রিয়াকরণের অনুরোধ।
metadataobject ( Struct format)ঐচ্ছিক। অনুরোধের সাথে সংশ্লিষ্ট মেটাডেটা।
| JSON প্রতিনিধিত্ব |
|---|
{
"request": {
object ( |
EmbedContentBatchOutput
একটি ব্যাচ অনুরোধের আউটপুট। এটি AsyncBatchEmbedContentResponse বা EmbedContentBatch.output ক্ষেত্রে ফেরত দেওয়া হয়।
outputUnion typeoutput নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: responsesFilestring শুধুমাত্র আউটপুট। প্রতিক্রিয়া ধারণকারী ফাইলের ফাইল আইডি। ফাইলটি প্রতি লাইনে একটি একক প্রতিক্রিয়া সহ একটি JSONL ফাইল হবে। প্রতিক্রিয়াগুলি JSON হিসাবে ফর্ম্যাট করা EmbedContentResponse বার্তা হবে৷ প্রতিক্রিয়াগুলি ইনপুট অনুরোধগুলির মতো একই ক্রমে লেখা হবে৷
inlinedResponsesobject ( InlinedEmbedContentResponses )শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের প্রতিক্রিয়া. ইনলাইনযুক্ত অনুরোধগুলি ব্যবহার করে ব্যাচ তৈরি করা হলে ফিরে এসেছে। প্রতিক্রিয়াগুলি ইনপুট অনুরোধগুলির মতো একই ক্রমে হবে৷
| JSON প্রতিনিধিত্ব |
|---|
{
// output
"responsesFile": string,
"inlinedResponses": {
object ( |
ইনলাইনড এম্বেড বিষয়বস্তু প্রতিক্রিয়া
ব্যাচে অনুরোধের প্রতিক্রিয়া.
inlinedResponses[]object ( InlinedEmbedContentResponse )শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের প্রতিক্রিয়া.
| JSON প্রতিনিধিত্ব |
|---|
{
"inlinedResponses": [
{
object ( |
ইনলাইন্ডএম্বেডকন্টেন্ট রেসপন্স
ব্যাচে একটি একক অনুরোধের প্রতিক্রিয়া।
metadataobject ( Struct format)শুধুমাত্র আউটপুট। অনুরোধের সাথে যুক্ত মেটাডেটা।
outputUnion typeoutput নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: errorobject ( Status )শুধুমাত্র আউটপুট। অনুরোধটি প্রক্রিয়া করার সময় ত্রুটির সম্মুখীন হয়েছে৷
responseobject ( EmbedContentResponse )শুধুমাত্র আউটপুট। অনুরোধের সাড়া।
| JSON প্রতিনিধিত্ব |
|---|
{ "metadata": { object }, // output "error": { object ( |
EmbedContentBatchStats
ব্যাচ সম্পর্কে পরিসংখ্যান.
requestCountstring ( int64 format)শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের সংখ্যা।
successfulRequestCountstring ( int64 format)শুধুমাত্র আউটপুট। সফলভাবে প্রসেস করা অনুরোধের সংখ্যা।
failedRequestCountstring ( int64 format)শুধুমাত্র আউটপুট। প্রসেস করা যায়নি এমন অনুরোধের সংখ্যা।
pendingRequestCountstring ( int64 format)শুধুমাত্র আউটপুট। এখনও প্রসেসিং বাকি আছে যে অনুরোধের সংখ্যা.
| JSON প্রতিনিধিত্ব |
|---|
{ "requestCount": string, "successfulRequestCount": string, "failedRequestCount": string, "pendingRequestCount": string } |