এমবেডিং হল টেক্সট ইনপুটের একটি সংখ্যাগত উপস্থাপনা যা অনেকগুলি অনন্য ব্যবহারের ক্ষেত্রে উন্মুক্ত করে, যেমন ক্লাস্টারিং, সাদৃশ্য পরিমাপ এবং তথ্য পুনরুদ্ধার। একটি ভূমিকার জন্য, এম্বেডিং গাইড দেখুন।
নতুন বিষয়বস্তু তৈরি করে এমন জেনারেটিভ এআই মডেলের বিপরীতে, জেমিনি এম্বেডিং মডেলটি শুধুমাত্র আপনার ইনপুট ডেটার বিন্যাসকে একটি সংখ্যাসূচক উপস্থাপনায় রূপান্তরিত করার উদ্দেশ্যে তৈরি করা হয়েছে। যদিও Google একটি এমবেডিং মডেল প্রদানের জন্য দায়ী যা আপনার ইনপুট ডেটার বিন্যাসকে অনুরোধ করা সংখ্যাসূচক-ফরম্যাটে রূপান্তর করে, ব্যবহারকারীরা তাদের ইনপুট করা ডেটা এবং ফলস্বরূপ এমবেডিংয়ের সম্পূর্ণ দায়বদ্ধতা বজায় রাখে। জেমিনি এম্বেডিং মডেল ব্যবহার করে আপনি নিশ্চিত করেন যে আপনার আপলোড করা যেকোনো বিষয়বস্তুর প্রয়োজনীয় অধিকার রয়েছে। অন্যের মেধা সম্পত্তি বা গোপনীয়তার অধিকার লঙ্ঘন করে এমন সামগ্রী তৈরি করবেন না। আপনার এই পরিষেবার ব্যবহার আমাদের নিষিদ্ধ ব্যবহারের নীতি এবং Google-এর পরিষেবার শর্তাবলীর সাপেক্ষে৷
পদ্ধতি: models.embedContent
নির্দিষ্ট জেমিনি এম্বেডিং মডেল ব্যবহার করে ইনপুট Content
থেকে একটি পাঠ্য এম্বেডিং ভেক্টর তৈরি করে৷
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:embedContent
পাথ প্যারামিটার
model
string
প্রয়োজন। মডেলের সম্পদের নাম। এটি মডেল ব্যবহার করার জন্য একটি আইডি হিসাবে কাজ করে।
এই নামটি models.list
পদ্ধতি দ্বারা প্রত্যাবর্তিত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model}
এটি ফর্ম models/{model}
লাগে।
শরীরের অনুরোধ
অনুরোধের অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
content
object ( Content
)
প্রয়োজন। এম্বেড করার বিষয়বস্তু। শুধুমাত্র parts.text
ক্ষেত্র গণনা করা হবে।
taskType
enum ( TaskType
)
ঐচ্ছিক। ঐচ্ছিক টাস্ক টাইপ যার জন্য এম্বেডিং ব্যবহার করা হবে। আগের মডেলগুলিতে সমর্থিত নয় ( models/embedding-001
)।
title
string
ঐচ্ছিক। পাঠ্যের জন্য একটি ঐচ্ছিক শিরোনাম। শুধুমাত্র টাস্কটাইপ RETRIEVAL_DOCUMENT
হলেই প্রযোজ্য।
দ্রষ্টব্য: RETRIEVAL_DOCUMENT
এর জন্য একটি title
নির্দিষ্ট করা পুনরুদ্ধারের জন্য আরও ভাল মানের এম্বেডিং প্রদান করে৷
outputDimensionality
integer
ঐচ্ছিক। আউটপুট এম্বেডিংয়ের জন্য ঐচ্ছিক হ্রাস মাত্রা। যদি সেট করা থাকে, আউটপুট এম্বেডিংয়ের অতিরিক্ত মান শেষ থেকে কেটে ফেলা হয়। শুধুমাত্র 2024 সাল থেকে নতুন মডেল দ্বারা সমর্থিত। পূর্ববর্তী মডেল ব্যবহার করলে আপনি এই মান সেট করতে পারবেন না ( models/embedding-001
)।
উদাহরণ অনুরোধ
পাইথন
Node.js
যাও
শেল
প্রতিক্রিয়া শরীর
সফল হলে, প্রতিক্রিয়া বডিতে EmbedContentResponse
এর একটি উদাহরণ থাকে।
পদ্ধতি: models.batchEmbedContents
ইনপুট Content
থেকে একাধিক এম্বেডিং ভেক্টর তৈরি করে যা EmbedContentRequest
অবজেক্ট হিসাবে উপস্থাপিত স্ট্রিংগুলির একটি ব্যাচ নিয়ে গঠিত।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:batchEmbedContents
পাথ প্যারামিটার
model
string
প্রয়োজন। মডেলের সম্পদের নাম। এটি মডেল ব্যবহার করার জন্য একটি আইডি হিসাবে কাজ করে।
এই নামটি models.list
পদ্ধতি দ্বারা প্রত্যাবর্তিত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model}
এটি ফর্ম models/{model}
লাগে।
শরীরের অনুরোধ
অনুরোধের অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
requests[]
object ( EmbedContentRequest
)
প্রয়োজন। ব্যাচের জন্য এম্বেড অনুরোধ. এই প্রতিটি অনুরোধের মডেলটি অবশ্যই নির্দিষ্ট BatchEmbedContentsRequest.model
মডেলের সাথে মিলবে।
উদাহরণ অনুরোধ
পাইথন
Node.js
যাও
শেল
প্রতিক্রিয়া শরীর
একটি BatchEmbedContentsRequest
এর প্রতিক্রিয়া।
সফল হলে, প্রতিক্রিয়া বডিতে নিম্নলিখিত কাঠামোর সাথে ডেটা থাকে:
embeddings[]
object ( ContentEmbedding
)
শুধুমাত্র আউটপুট। প্রতিটি অনুরোধের জন্য এমবেডিং, ব্যাচ অনুরোধে দেওয়া একই ক্রমে।
JSON প্রতিনিধিত্ব |
---|
{
"embeddings": [
{
object ( |
পদ্ধতি: models.asyncBatchEmbedContent
ব্যাচ প্রক্রিয়াকরণের জন্য models.embedContent
অনুরোধের একটি ব্যাচ সারিবদ্ধ করে। GenerativeService
এ আমাদের একটি models.batchEmbedContents
হ্যান্ডলার আছে, কিন্তু এটি সিঙ্ক্রোনাইজ করা হয়েছে। তাই আমরা বিভ্রান্তি এড়াতে এটির নাম Async
রাখি।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{batch.model=models /*}:asyncBatchEmbedContent
পাথ প্যারামিটার
batch.model
string
প্রয়োজন। সমাপ্তি তৈরি করার জন্য ব্যবহার করা Model
নাম।
বিন্যাস: models/{model}
। এটি ফর্ম models/{model}
লাগে।
শরীরের অনুরোধ
অনুরোধের অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
batch.name
string
শুধুমাত্র আউটপুট। শনাক্তকারী। ব্যাচের সম্পদের নাম।
বিন্যাস: batches/{batchId}
।
batch.displayName
string
প্রয়োজন। এই ব্যাচের ব্যবহারকারী-সংজ্ঞায়িত নাম।
batch.inputConfig
object ( InputEmbedContentConfig
)
প্রয়োজন। ইনপুট কনফিগারেশন যেখানে ব্যাচ প্রক্রিয়াকরণ সঞ্চালিত হয়.
batch.output
object ( EmbedContentBatchOutput
)
শুধুমাত্র আউটপুট। ব্যাচের অনুরোধের আউটপুট।
batch.createTime
string ( Timestamp
format)
শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ তৈরি হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
বা "2014-10-02T15:01:23+05:30"
batch.endTime
string ( Timestamp
format)
শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ প্রক্রিয়াকরণ সম্পন্ন হয়েছে।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
বা "2014-10-02T15:01:23+05:30"
batch.updateTime
string ( Timestamp
format)
শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ শেষ আপডেট করা হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
বা "2014-10-02T15:01:23+05:30"
batch.batchStats
object ( EmbedContentBatchStats
)
শুধুমাত্র আউটপুট। ব্যাচ সম্পর্কে পরিসংখ্যান.
batch.state
enum ( BatchState
)
শুধুমাত্র আউটপুট। ব্যাচের অবস্থা।
batch.priority
string ( int64 format)
ঐচ্ছিক। ব্যাচের অগ্রাধিকার। একটি উচ্চ অগ্রাধিকার মান সঙ্গে ব্যাচ একটি নিম্ন অগ্রাধিকার মান সঙ্গে ব্যাচ আগে প্রক্রিয়া করা হবে. নেতিবাচক মান অনুমোদিত. ডিফল্ট 0।
প্রতিক্রিয়া শরীর
সফল হলে, প্রতিক্রিয়া বডিতে Operation
একটি উদাহরণ থাকে।
EmbedContentRequest
মডেলটি এম্বেড করার জন্য Content
সহ অনুরোধ৷
model
string
প্রয়োজন। মডেলের সম্পদের নাম। এটি মডেল ব্যবহার করার জন্য একটি আইডি হিসাবে কাজ করে।
এই নামটি models.list
পদ্ধতি দ্বারা প্রত্যাবর্তিত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model}
content
object ( Content
)
প্রয়োজন। এম্বেড করার বিষয়বস্তু। শুধুমাত্র parts.text
ক্ষেত্র গণনা করা হবে।
taskType
enum ( TaskType
)
ঐচ্ছিক। ঐচ্ছিক টাস্ক টাইপ যার জন্য এম্বেডিং ব্যবহার করা হবে। আগের মডেলগুলিতে সমর্থিত নয় ( models/embedding-001
)।
title
string
ঐচ্ছিক। পাঠ্যের জন্য একটি ঐচ্ছিক শিরোনাম। শুধুমাত্র টাস্কটাইপ RETRIEVAL_DOCUMENT
হলেই প্রযোজ্য।
দ্রষ্টব্য: RETRIEVAL_DOCUMENT
এর জন্য একটি title
নির্দিষ্ট করা পুনরুদ্ধারের জন্য আরও ভাল মানের এম্বেডিং প্রদান করে৷
outputDimensionality
integer
ঐচ্ছিক। আউটপুট এম্বেডিংয়ের জন্য ঐচ্ছিক হ্রাস মাত্রা। যদি সেট করা থাকে, আউটপুট এম্বেডিংয়ের অতিরিক্ত মান শেষ থেকে কেটে ফেলা হয়। শুধুমাত্র 2024 সাল থেকে নতুন মডেল দ্বারা সমর্থিত। পূর্ববর্তী মডেল ব্যবহার করলে আপনি এই মান সেট করতে পারবেন না ( models/embedding-001
)।
EmbedContentResponse
একটি EmbedContentRequest
এর প্রতিক্রিয়া।
embedding
object ( ContentEmbedding
)
শুধুমাত্র আউটপুট। ইনপুট বিষয়বস্তু থেকে উৎপন্ন এমবেডিং।
JSON প্রতিনিধিত্ব |
---|
{
"embedding": {
object ( |
কন্টেন্ট এম্বেডিং
একটি এমবেডিং প্রতিনিধিত্বকারী ফ্লোটগুলির একটি তালিকা৷
values[]
number
এমবেডিং মান.
JSON প্রতিনিধিত্ব |
---|
{ "values": [ number ] } |
টাস্ক টাইপ
টাস্কের ধরন যার জন্য এম্বেডিং ব্যবহার করা হবে।
এনামস | |
---|---|
TASK_TYPE_UNSPECIFIED | আনসেট মান, যা অন্যান্য enum মানগুলির একটিতে ডিফল্ট হবে। |
RETRIEVAL_QUERY | প্রদত্ত টেক্সট একটি অনুসন্ধান/পুনরুদ্ধার সেটিং একটি ক্যোয়ারী নির্দিষ্ট করে. |
RETRIEVAL_DOCUMENT | প্রদত্ত পাঠ্যটি অনুসন্ধান করা কর্পাস থেকে একটি নথি নির্দিষ্ট করে৷ |
SEMANTIC_SIMILARITY | প্রদত্ত পাঠ্যটি STS-এর জন্য ব্যবহার করা হবে তা নির্দিষ্ট করে। |
CLASSIFICATION | নির্দিষ্ট করে যে প্রদত্ত পাঠ্যটি শ্রেণীবদ্ধ করা হবে। |
CLUSTERING | নির্দিষ্ট করে যে এমবেডিংগুলি ক্লাস্টারিংয়ের জন্য ব্যবহার করা হবে৷ |
QUESTION_ANSWERING | নির্দিষ্ট করে যে প্রদত্ত পাঠ্যটি প্রশ্নের উত্তরের জন্য ব্যবহার করা হবে। |
FACT_VERIFICATION | উল্লেখ করে যে প্রদত্ত পাঠ্য সত্য যাচাইয়ের জন্য ব্যবহার করা হবে। |
CODE_RETRIEVAL_QUERY | নির্দিষ্ট করে যে প্রদত্ত পাঠ্যটি কোড পুনরুদ্ধারের জন্য ব্যবহার করা হবে। |
EmbedContentBatch
- JSON প্রতিনিধিত্ব
- InputEmbedContentConfig
- ইনলাইনড এম্বেড কন্টেন্ট অনুরোধ
- ইনলাইনডএম্বেডকন্টেন্টরিকোয়েস্ট
- EmbedContentBatchOutput
- ইনলাইনড এম্বেড বিষয়বস্তু প্রতিক্রিয়া
- ইনলাইন্ডএম্বেডকন্টেন্ট রেসপন্স
- EmbedContentBatchStats
EmbedContent
অনুরোধের একটি ব্যাচের প্রতিনিধিত্বকারী একটি সংস্থান।
model
string
প্রয়োজন। সমাপ্তি তৈরি করার জন্য ব্যবহার করা Model
নাম।
বিন্যাস: models/{model}
।
name
string
শুধুমাত্র আউটপুট। শনাক্তকারী। ব্যাচের সম্পদের নাম।
বিন্যাস: batches/{batchId}
।
displayName
string
প্রয়োজন। এই ব্যাচের ব্যবহারকারী-সংজ্ঞায়িত নাম।
inputConfig
object ( InputEmbedContentConfig
)
প্রয়োজন। ইনপুট কনফিগারেশন যেখানে ব্যাচ প্রক্রিয়াকরণ সঞ্চালিত হয়.
output
object ( EmbedContentBatchOutput
)
শুধুমাত্র আউটপুট। ব্যাচের অনুরোধের আউটপুট।
createTime
string ( Timestamp
format)
শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ তৈরি হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
বা "2014-10-02T15:01:23+05:30"
endTime
string ( Timestamp
format)
শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ প্রক্রিয়াকরণ সম্পন্ন হয়েছে।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
বা "2014-10-02T15:01:23+05:30"
updateTime
string ( Timestamp
format)
শুধুমাত্র আউটপুট। যে সময়ে ব্যাচ শেষ আপডেট করা হয়েছিল।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-সাধারণ করা হবে এবং 0, 3, 6 বা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণ করা হয়। উদাহরণ: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
বা "2014-10-02T15:01:23+05:30"
batchStats
object ( EmbedContentBatchStats
)
শুধুমাত্র আউটপুট। ব্যাচ সম্পর্কে পরিসংখ্যান.
state
enum ( BatchState
)
শুধুমাত্র আউটপুট। ব্যাচের অবস্থা।
priority
string ( int64 format)
ঐচ্ছিক। ব্যাচের অগ্রাধিকার। একটি উচ্চ অগ্রাধিকার মান সঙ্গে ব্যাচ একটি নিম্ন অগ্রাধিকার মান সঙ্গে ব্যাচ আগে প্রক্রিয়া করা হবে. নেতিবাচক মান অনুমোদিত. ডিফল্ট 0।
JSON প্রতিনিধিত্ব |
---|
{ "model": string, "name": string, "displayName": string, "inputConfig": { object ( |
InputEmbedContentConfig
ব্যাচের অনুরোধে ইনপুট কনফিগার করে।
source
Union type
source
নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: fileName
string
ইনপুট অনুরোধ ধারণকারী File
নাম।
requests
object ( InlinedEmbedContentRequests
)
অনুরোধগুলি ব্যাচে প্রক্রিয়াকরণ করা হবে৷
JSON প্রতিনিধিত্ব |
---|
{
// source
"fileName": string,
"requests": {
object ( |
ইনলাইনড এম্বেড কন্টেন্ট অনুরোধ
ব্যাচ তৈরির অনুরোধের অংশ হিসাবে প্রদান করা হলে ব্যাচে প্রক্রিয়া করা হবে।
requests[]
object ( InlinedEmbedContentRequest
)
প্রয়োজন। অনুরোধগুলি ব্যাচে প্রক্রিয়াকরণ করা হবে৷
JSON প্রতিনিধিত্ব |
---|
{
"requests": [
{
object ( |
ইনলাইনডএম্বেডকন্টেন্টরিকোয়েস্ট
ব্যাচে প্রক্রিয়াকরণের অনুরোধ।
request
object ( EmbedContentRequest
)
প্রয়োজন। ব্যাচে প্রক্রিয়াকরণের অনুরোধ।
metadata
object ( Struct
format)
ঐচ্ছিক। অনুরোধের সাথে সংশ্লিষ্ট মেটাডেটা।
JSON প্রতিনিধিত্ব |
---|
{
"request": {
object ( |
EmbedContentBatchOutput
একটি ব্যাচ অনুরোধের আউটপুট। এটি AsyncBatchEmbedContentResponse
বা EmbedContentBatch.output
ক্ষেত্রে ফেরত দেওয়া হয়।
output
Union type
output
নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: responsesFile
string
শুধুমাত্র আউটপুট। প্রতিক্রিয়া ধারণকারী ফাইলের ফাইল আইডি। ফাইলটি প্রতি লাইনে একটি একক প্রতিক্রিয়া সহ একটি JSONL ফাইল হবে। প্রতিক্রিয়াগুলি JSON হিসাবে ফর্ম্যাট করা EmbedContentResponse
বার্তা হবে৷ প্রতিক্রিয়াগুলি ইনপুট অনুরোধগুলির মতো একই ক্রমে লেখা হবে৷
inlinedResponses
object ( InlinedEmbedContentResponses
)
শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের প্রতিক্রিয়া. ইনলাইনযুক্ত অনুরোধগুলি ব্যবহার করে ব্যাচ তৈরি করা হলে ফিরে এসেছে। প্রতিক্রিয়াগুলি ইনপুট অনুরোধগুলির মতো একই ক্রমে হবে৷
JSON প্রতিনিধিত্ব |
---|
{
// output
"responsesFile": string,
"inlinedResponses": {
object ( |
ইনলাইনড এম্বেড বিষয়বস্তু প্রতিক্রিয়া
ব্যাচে অনুরোধের প্রতিক্রিয়া.
inlinedResponses[]
object ( InlinedEmbedContentResponse
)
শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের প্রতিক্রিয়া.
JSON প্রতিনিধিত্ব |
---|
{
"inlinedResponses": [
{
object ( |
ইনলাইন্ডএম্বেডকন্টেন্ট রেসপন্স
ব্যাচে একটি একক অনুরোধের প্রতিক্রিয়া।
metadata
object ( Struct
format)
শুধুমাত্র আউটপুট। অনুরোধের সাথে যুক্ত মেটাডেটা।
output
Union type
output
নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: error
object ( Status
)
শুধুমাত্র আউটপুট। অনুরোধটি প্রক্রিয়া করার সময় ত্রুটির সম্মুখীন হয়েছে৷
response
object ( EmbedContentResponse
)
শুধুমাত্র আউটপুট। অনুরোধের সাড়া।
JSON প্রতিনিধিত্ব |
---|
{ "metadata": { object }, // output "error": { object ( |
EmbedContentBatchStats
ব্যাচ সম্পর্কে পরিসংখ্যান.
requestCount
string ( int64 format)
শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের সংখ্যা।
successfulRequestCount
string ( int64 format)
শুধুমাত্র আউটপুট। সফলভাবে প্রসেস করা অনুরোধের সংখ্যা।
failedRequestCount
string ( int64 format)
শুধুমাত্র আউটপুট। প্রসেস করা যায়নি এমন অনুরোধের সংখ্যা।
pendingRequestCount
string ( int64 format)
শুধুমাত্র আউটপুট। এখনও প্রসেসিং বাকি আছে যে অনুরোধের সংখ্যা.
JSON প্রতিনিধিত্ব |
---|
{ "requestCount": string, "successfulRequestCount": string, "failedRequestCount": string, "pendingRequestCount": string } |