এম্বেডিং হল টেক্সট ইনপুটের একটি সংখ্যাসূচক উপস্থাপনা যা ক্লাস্টারিং, সাদৃশ্য পরিমাপ এবং তথ্য পুনরুদ্ধারের মতো অনেকগুলি অনন্য ব্যবহারের ক্ষেত্র উন্মুক্ত করে। ভূমিকার জন্য, এম্বেডিং নির্দেশিকাটি দেখুন।
জেনারেটিভ এআই মডেলগুলি যা নতুন কন্টেন্ট তৈরি করে তার বিপরীতে, জেমিনি এম্বেডিং মডেলটি কেবল আপনার ইনপুট ডেটার ফর্ম্যাটকে একটি সংখ্যাসূচক উপস্থাপনায় রূপান্তর করার উদ্দেশ্যে তৈরি। যদিও গুগল একটি এমবেডিং মডেল সরবরাহ করার জন্য দায়ী যা আপনার ইনপুট ডেটার ফর্ম্যাটকে অনুরোধ করা সংখ্যাসূচক-ফরম্যাটে রূপান্তরিত করে, ব্যবহারকারীরা তাদের ইনপুট করা ডেটা এবং এর ফলে এম্বেডিংয়ের সম্পূর্ণ দায়িত্ব বহন করে। জেমিনি এম্বেডিং মডেল ব্যবহার করে আপনি নিশ্চিত করেন যে আপনার আপলোড করা যেকোনো কন্টেন্টের উপর আপনার প্রয়োজনীয় অধিকার রয়েছে। এমন কন্টেন্ট তৈরি করবেন না যা অন্যদের বৌদ্ধিক সম্পত্তি বা গোপনীয়তার অধিকার লঙ্ঘন করে। এই পরিষেবার আপনার ব্যবহার আমাদের নিষিদ্ধ ব্যবহার নীতি এবং গুগলের পরিষেবার শর্তাবলী সাপেক্ষে।
পদ্ধতি: models.embedContent
নির্দিষ্ট জেমিনি এম্বেডিং মডেল ব্যবহার করে ইনপুট Content থেকে একটি টেক্সট এম্বেডিং ভেক্টর তৈরি করে।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:embedContentপথের পরামিতি
modelstringপ্রয়োজনীয়। মডেলের রিসোর্স নাম। এটি মডেলের ব্যবহারের জন্য একটি আইডি হিসেবে কাজ করে।
এই নামটি models.list পদ্ধতি দ্বারা প্রদত্ত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model} এটি models/{model} রূপ নেয়।
অনুরোধের মূল অংশ
অনুরোধের মূল অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
contentobject ( Content ) প্রয়োজনীয়। এম্বেড করার জন্য কন্টেন্ট। শুধুমাত্র parts.text ক্ষেত্রগুলি গণনা করা হবে।
taskTypeenum ( TaskType ) ঐচ্ছিক। ঐচ্ছিক কাজের ধরণ যার জন্য এম্বেডিং ব্যবহার করা হবে। পূর্ববর্তী মডেলগুলিতে সমর্থিত নয় ( models/embedding-001 )।
titlestring ঐচ্ছিক। লেখার জন্য একটি ঐচ্ছিক শিরোনাম। শুধুমাত্র তখনই প্রযোজ্য যখন TaskType RETRIEVAL_DOCUMENT হয়।
দ্রষ্টব্য: RETRIEVAL_DOCUMENT এর জন্য একটি title নির্দিষ্ট করলে পুনরুদ্ধারের জন্য আরও ভালো মানের এম্বেডিং পাওয়া যায়।
outputDimensionalityinteger ঐচ্ছিক। আউটপুট এম্বেডিংয়ের জন্য ঐচ্ছিক হ্রাসকৃত মাত্রা। যদি সেট করা থাকে, তাহলে আউটপুট এম্বেডিংয়ের অতিরিক্ত মানগুলি শেষ থেকে কেটে ফেলা হবে। 2024 সাল থেকে শুধুমাত্র নতুন মডেলগুলি দ্বারা সমর্থিত। পূর্ববর্তী মডেল ( models/embedding-001 ) ব্যবহার করলে আপনি এই মানটি সেট করতে পারবেন না।
উদাহরণ অনুরোধ
পাইথন
নোড.জেএস
যাও
শেল
প্রতিক্রিয়া মূল অংশ
যদি সফল হয়, তাহলে রেসপন্স বডিতে EmbedContentResponse এর একটি উদাহরণ থাকবে।
পদ্ধতি: models.batchEmbedContents
ইনপুট Content থেকে একাধিক এম্বেডিং ভেক্টর তৈরি করে যা EmbedContentRequest অবজেক্ট হিসেবে উপস্থাপিত স্ট্রিংগুলির একটি ব্যাচ নিয়ে গঠিত।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:batchEmbedContentsপথের পরামিতি
modelstringপ্রয়োজনীয়। মডেলের রিসোর্স নাম। এটি মডেলের ব্যবহারের জন্য একটি আইডি হিসেবে কাজ করে।
এই নামটি models.list পদ্ধতি দ্বারা প্রদত্ত একটি মডেল নামের সাথে মিলিত হওয়া উচিত।
বিন্যাস: models/{model} এটি models/{model} রূপ নেয়।
অনুরোধের মূল অংশ
অনুরোধের মূল অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
requests[]object ( EmbedContentRequest ) প্রয়োজনীয়। ব্যাচের জন্য অনুরোধগুলি এম্বেড করুন। এই প্রতিটি অনুরোধের মডেলটি অবশ্যই নির্দিষ্ট মডেলের সাথে মিলবে BatchEmbedContentsRequest.model ।
উদাহরণ অনুরোধ
পাইথন
নোড.জেএস
যাও
শেল
প্রতিক্রিয়া মূল অংশ
একটি BatchEmbedContentsRequest এর প্রতিক্রিয়া।
যদি সফল হয়, তাহলে রেসপন্স বডিতে নিম্নলিখিত কাঠামো সহ ডেটা থাকবে:
embeddings[]object ( ContentEmbedding )শুধুমাত্র আউটপুট। প্রতিটি অনুরোধের জন্য এম্বেডিং, ব্যাচ অনুরোধে প্রদত্ত একই ক্রমে।
| JSON উপস্থাপনা |
|---|
{
"embeddings": [
{
object ( |
পদ্ধতি: models.asyncBatchEmbedContent
ব্যাচ প্রসেসিংয়ের জন্য models.embedContent অনুরোধের একটি ব্যাচ এনকুইজ করে। GenerativeService তে আমাদের একটি models.batchEmbedContents হ্যান্ডলার আছে, কিন্তু এটি সিঙ্ক্রোনাইজ করা হয়েছিল। তাই বিভ্রান্তি এড়াতে আমরা এটির নাম Async রাখি।
শেষবিন্দু
পোস্টhttps: / /generativelanguage.googleapis.com /v1beta /{batch.model=models /*}:asyncBatchEmbedContentপথের পরামিতি
batch.modelstring প্রয়োজনীয়। সমাপ্তি তৈরির জন্য ব্যবহৃত Model নাম।
ফর্ম্যাট: models/{model} । এটি models/{model} রূপ নেয়।
অনুরোধের মূল অংশ
অনুরোধের মূল অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
batch.namestringশুধুমাত্র আউটপুট। শনাক্তকারী। ব্যাচের রিসোর্সের নাম।
ফর্ম্যাট: batches/{batchId} .
batch.displayNamestringপ্রয়োজনীয়। এই ব্যাচের ব্যবহারকারী-সংজ্ঞায়িত নাম।
batch.inputConfigobject ( InputEmbedContentConfig )প্রয়োজনীয়। ব্যাচ প্রক্রিয়াকরণ সম্পাদিত দৃষ্টান্তগুলির ইনপুট কনফিগারেশন।
batch.outputobject ( EmbedContentBatchOutput )শুধুমাত্র আউটপুট। ব্যাচ অনুরোধের আউটপুট।
batch.createTimestring ( Timestamp format)শুধুমাত্র আউটপুট। ব্যাচ তৈরির সময়।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-স্বাভাবিক হবে এবং 0, 3, 6 অথবা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণযোগ্য। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" অথবা "2014-10-02T15:01:23+05:30" ।
batch.endTimestring ( Timestamp format)শুধুমাত্র আউটপুট। ব্যাচ প্রক্রিয়াকরণ সম্পন্ন হওয়ার সময়।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-স্বাভাবিক হবে এবং 0, 3, 6 অথবা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণযোগ্য। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" অথবা "2014-10-02T15:01:23+05:30" ।
batch.updateTimestring ( Timestamp format)শুধুমাত্র আউটপুট। ব্যাচটি শেষ আপডেট করার সময়।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-স্বাভাবিক হবে এবং 0, 3, 6 অথবা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণযোগ্য। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" অথবা "2014-10-02T15:01:23+05:30" ।
batch.batchStatsobject ( EmbedContentBatchStats )শুধুমাত্র আউটপুট। ব্যাচ সম্পর্কে পরিসংখ্যান।
batch.stateenum ( BatchState )শুধুমাত্র আউটপুট। ব্যাচের অবস্থা।
batch.prioritystring ( int64 format)ঐচ্ছিক। ব্যাচের অগ্রাধিকার। উচ্চতর অগ্রাধিকার মান সম্পন্ন ব্যাচগুলি কম অগ্রাধিকার মান সম্পন্ন ব্যাচের আগে প্রক্রিয়া করা হবে। নেতিবাচক মান অনুমোদিত। ডিফল্ট মান 0।
প্রতিক্রিয়া মূল অংশ
যদি সফল হয়, তাহলে রেসপন্স বডিতে Operation এর একটি উদাহরণ থাকবে।
এম্বেডকন্টেন্টরেসপন্স
একটি EmbedContentRequest এর প্রতিক্রিয়া।
embeddingobject ( ContentEmbedding )শুধুমাত্র আউটপুট। ইনপুট কন্টেন্ট থেকে তৈরি এম্বেডিং।
| JSON উপস্থাপনা |
|---|
{
"embedding": {
object ( |
কন্টেন্ট এম্বেডিং
একটি এমবেডিং প্রতিনিধিত্বকারী ভাসমানগুলির একটি তালিকা।
values[]numberএম্বেডিং মান।
| JSON উপস্থাপনা |
|---|
{ "values": [ number ] } |
টাস্ক টাইপ
যে ধরণের কাজের জন্য এম্বেডিং ব্যবহার করা হবে।
| এনামস | |
|---|---|
TASK_TYPE_UNSPECIFIED | মান সেট না করা, যা অন্য একটি enum মানের ডিফল্ট হবে। |
RETRIEVAL_QUERY | প্রদত্ত টেক্সটটি একটি অনুসন্ধান/পুনরুদ্ধার সেটিংসে একটি কোয়েরি হিসাবে নির্দিষ্ট করে। |
RETRIEVAL_DOCUMENT | প্রদত্ত টেক্সটটি অনুসন্ধান করা হচ্ছে এমন কর্পাস থেকে একটি নথি তা নির্দিষ্ট করে। |
SEMANTIC_SIMILARITY | প্রদত্ত টেক্সটটি STS-এর জন্য ব্যবহৃত হবে তা নির্দিষ্ট করে। |
CLASSIFICATION | নির্দিষ্ট করে যে প্রদত্ত পাঠ্য শ্রেণীবদ্ধ করা হবে। |
CLUSTERING | নির্দিষ্ট করে যে এম্বেডিংগুলি ক্লাস্টারিংয়ের জন্য ব্যবহার করা হবে। |
QUESTION_ANSWERING | নির্দিষ্ট করে যে প্রদত্ত টেক্সটটি প্রশ্নের উত্তরের জন্য ব্যবহার করা হবে। |
FACT_VERIFICATION | নির্দিষ্ট করে যে প্রদত্ত টেক্সটটি সত্যতা যাচাইয়ের জন্য ব্যবহার করা হবে। |
CODE_RETRIEVAL_QUERY | নির্দিষ্ট করে যে প্রদত্ত টেক্সটটি কোড পুনরুদ্ধারের জন্য ব্যবহার করা হবে। |
এম্বেডকন্টেন্টব্যাচ
- JSON উপস্থাপনা
- ইনপুটএম্বেডকন্টেন্টকনফিগ
- ইনলাইন করা হয়েছেএমবেডকন্টেন্টরিকোয়েস্ট
- ইনলাইন করা হয়েছেএমবেডকন্টেন্টরিকোয়েস্ট
- এম্বেডকন্টেন্টব্যাচআউটপুট
- ইনলাইন করা হয়েছেএমবেডকন্টেন্টপ্রতিক্রিয়া
- ইনলাইন করা হয়েছেএমবেডকন্টেন্টরেসপন্স
- এম্বেডকন্টেন্টব্যাচস্ট্যাটস
EmbedContent অনুরোধের একটি ব্যাচ প্রতিনিধিত্বকারী একটি রিসোর্স।
modelstring প্রয়োজনীয়। সমাপ্তি তৈরির জন্য ব্যবহৃত Model নাম।
বিন্যাস: models/{model} .
namestringশুধুমাত্র আউটপুট। শনাক্তকারী। ব্যাচের রিসোর্সের নাম।
ফর্ম্যাট: batches/{batchId} .
displayNamestringপ্রয়োজনীয়। এই ব্যাচের ব্যবহারকারী-সংজ্ঞায়িত নাম।
inputConfigobject ( InputEmbedContentConfig )প্রয়োজনীয়। ব্যাচ প্রক্রিয়াকরণ সম্পাদিত দৃষ্টান্তগুলির ইনপুট কনফিগারেশন।
outputobject ( EmbedContentBatchOutput )শুধুমাত্র আউটপুট। ব্যাচ অনুরোধের আউটপুট।
createTimestring ( Timestamp format)শুধুমাত্র আউটপুট। ব্যাচ তৈরির সময়।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-স্বাভাবিক হবে এবং 0, 3, 6 অথবা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণযোগ্য। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" অথবা "2014-10-02T15:01:23+05:30" ।
endTimestring ( Timestamp format)শুধুমাত্র আউটপুট। ব্যাচ প্রক্রিয়াকরণ সম্পন্ন হওয়ার সময়।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-স্বাভাবিক হবে এবং 0, 3, 6 অথবা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণযোগ্য। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" অথবা "2014-10-02T15:01:23+05:30" ।
updateTimestring ( Timestamp format)শুধুমাত্র আউটপুট। ব্যাচটি শেষ আপডেট করার সময়।
RFC 3339 ব্যবহার করে, যেখানে উৎপন্ন আউটপুট সর্বদা Z-স্বাভাবিক হবে এবং 0, 3, 6 অথবা 9 ভগ্নাংশ সংখ্যা ব্যবহার করবে। "Z" ব্যতীত অন্যান্য অফসেটগুলিও গ্রহণযোগ্য। উদাহরণ: "2014-10-02T15:01:23Z" , "2014-10-02T15:01:23.045123456Z" অথবা "2014-10-02T15:01:23+05:30" ।
batchStatsobject ( EmbedContentBatchStats )শুধুমাত্র আউটপুট। ব্যাচ সম্পর্কে পরিসংখ্যান।
stateenum ( BatchState )শুধুমাত্র আউটপুট। ব্যাচের অবস্থা।
prioritystring ( int64 format)ঐচ্ছিক। ব্যাচের অগ্রাধিকার। উচ্চতর অগ্রাধিকার মান সম্পন্ন ব্যাচগুলি কম অগ্রাধিকার মান সম্পন্ন ব্যাচের আগে প্রক্রিয়া করা হবে। নেতিবাচক মান অনুমোদিত। ডিফল্ট মান 0।
| JSON উপস্থাপনা |
|---|
{ "model": string, "name": string, "displayName": string, "inputConfig": { object ( |
ইনপুটএম্বেডকন্টেন্টকনফিগ
ব্যাচ অনুরোধের ইনপুট কনফিগার করে।
sourceUnion typesource নিম্নলিখিতগুলির মধ্যে কেবল একটি হতে পারে: fileNamestring ইনপুট অনুরোধ ধারণকারী File নাম।
requestsobject ( InlinedEmbedContentRequests )ব্যাচে প্রক্রিয়াকরণের অনুরোধগুলি।
| JSON উপস্থাপনা |
|---|
{
// source
"fileName": string,
"requests": {
object ( |
ইনলাইন করা হয়েছেএমবেডকন্টেন্টরিকোয়েস্ট
ব্যাচ তৈরির অনুরোধের অংশ হিসেবে সরবরাহ করা হলে, ব্যাচে প্রক্রিয়াকরণের জন্য অনুরোধগুলি।
requests[]object ( InlinedEmbedContentRequest )প্রয়োজনীয়। ব্যাচে প্রক্রিয়াকরণের অনুরোধ।
| JSON উপস্থাপনা |
|---|
{
"requests": [
{
object ( |
ইনলাইন করা হয়েছেএমবেডকন্টেন্টরিকোয়েস্ট
ব্যাচে প্রক্রিয়া করার অনুরোধ।
requestobject ( EmbedContentRequest )প্রয়োজনীয়। অনুরোধটি ব্যাচে প্রক্রিয়া করা হবে।
metadataobject ( Struct format)ঐচ্ছিক। অনুরোধের সাথে যুক্ত মেটাডেটা।
| JSON উপস্থাপনা |
|---|
{
"request": {
object ( |
এম্বেডকন্টেন্টব্যাচআউটপুট
একটি ব্যাচ অনুরোধের আউটপুট। এটি AsyncBatchEmbedContentResponse অথবা EmbedContentBatch.output ক্ষেত্রে ফেরত পাঠানো হয়।
outputUnion typeoutput নিম্নলিখিতগুলির মধ্যে কেবল একটি হতে পারে: responsesFilestring শুধুমাত্র আউটপুট। যে ফাইলটিতে প্রতিক্রিয়াগুলি রয়েছে তার ফাইল আইডি। ফাইলটি একটি JSONL ফাইল হবে যার প্রতি লাইনে একটি করে প্রতিক্রিয়া থাকবে। প্রতিক্রিয়াগুলি EmbedContentResponse বার্তাগুলিকে JSON ফর্ম্যাটে লেখা হবে। প্রতিক্রিয়াগুলি ইনপুট অনুরোধগুলির মতো একই ক্রমে লেখা হবে।
inlinedResponsesobject ( InlinedEmbedContentResponses )শুধুমাত্র আউটপুট। ব্যাচের অনুরোধগুলির প্রতিক্রিয়া। ইনলাইন করা অনুরোধগুলি ব্যবহার করে ব্যাচটি তৈরি করার সময় ফিরে আসে। প্রতিক্রিয়াগুলি ইনপুট অনুরোধগুলির মতো একই ক্রমে থাকবে।
| JSON উপস্থাপনা |
|---|
{
// output
"responsesFile": string,
"inlinedResponses": {
object ( |
ইনলাইন করা হয়েছেএমবেডকন্টেন্টপ্রতিক্রিয়া
ব্যাচের অনুরোধগুলির উত্তর।
inlinedResponses[]object ( InlinedEmbedContentResponse )শুধুমাত্র আউটপুট। ব্যাচের অনুরোধগুলির প্রতিক্রিয়া।
| JSON উপস্থাপনা |
|---|
{
"inlinedResponses": [
{
object ( |
ইনলাইন করা হয়েছেএমবেডকন্টেন্টরেসপন্স
ব্যাচের একটি মাত্র অনুরোধের প্রতিক্রিয়া।
metadataobject ( Struct format)শুধুমাত্র আউটপুট। অনুরোধের সাথে সম্পর্কিত মেটাডেটা।
outputUnion typeoutput এর আউটপুট নিম্নলিখিতগুলির মধ্যে কেবল একটি হতে পারে: errorobject ( Status )শুধুমাত্র আউটপুট। অনুরোধটি প্রক্রিয়া করার সময় ত্রুটি দেখা দিয়েছে।
responseobject ( EmbedContentResponse )শুধুমাত্র আউটপুট। অনুরোধের প্রতিক্রিয়া।
| JSON উপস্থাপনা |
|---|
{ "metadata": { object }, // output "error": { object ( |
এম্বেডকন্টেন্টব্যাচস্ট্যাটস
ব্যাচ সম্পর্কে পরিসংখ্যান।
requestCountstring ( int64 format)শুধুমাত্র আউটপুট। ব্যাচে অনুরোধের সংখ্যা।
successfulRequestCountstring ( int64 format)শুধুমাত্র আউটপুট। সফলভাবে প্রক্রিয়া করা অনুরোধের সংখ্যা।
failedRequestCountstring ( int64 format)শুধুমাত্র আউটপুট। প্রক্রিয়াকরণে ব্যর্থ অনুরোধের সংখ্যা।
pendingRequestCountstring ( int64 format)শুধুমাত্র আউটপুট। প্রক্রিয়াকরণের জন্য এখনও অপেক্ষারত অনুরোধের সংখ্যা।
| JSON উপস্থাপনা |
|---|
{ "requestCount": string, "successfulRequestCount": string, "failedRequestCount": string, "pendingRequestCount": string } |