কৃত্রিম বুদ্ধিমত্তা (AI) মডেলের জেমিনি পরিবার পাঠ্য, ছবি এবং অডিও সহ বিভিন্ন ধরণের ইনপুট ডেটা পরিচালনা করার জন্য তৈরি করা হয়েছে৷ যেহেতু এই মডেলগুলি একাধিক প্রকার বা ডেটা মোড পরিচালনা করতে পারে, তাই মিথুন মডেলগুলিকে মাল্টিমোডাল মডেল বলা হয় বা মাল্টিমোডাল ক্ষমতা রয়েছে বলে ব্যাখ্যা করা হয়।
ফাইল API ব্যবহার করে মিডিয়া ফাইলগুলির সাথে কীভাবে কাজ করবেন তা এই নির্দেশিকা আপনাকে দেখায়। মৌলিক ক্রিয়াকলাপগুলি অডিও ফাইল, ছবি, ভিডিও, নথি এবং অন্যান্য সমর্থিত ফাইল প্রকারের জন্য একই।
ফাইল প্রম্পট গাইডেন্সের জন্য, ফাইল প্রম্পট গাইড বিভাগটি দেখুন।
একটি ফাইল আপলোড করুন
আপনি একটি মিডিয়া ফাইল আপলোড করতে Files API ব্যবহার করতে পারেন। সর্বদা ফাইল API ব্যবহার করুন যখন মোট অনুরোধের আকার (ফাইল, টেক্সট প্রম্পট, সিস্টেম নির্দেশাবলী, ইত্যাদি সহ) 20 MB এর থেকে বড় হয়৷
নিম্নলিখিত কোডটি একটি ফাইল আপলোড করে এবং তারপরে generateContent
করতে একটি কলে ফাইলটি ব্যবহার করে।
পাইথন
from google import genai
client = genai.Client(api_key="GOOGLE_API_KEY")
myfile = client.files.upload(file="path/to/sample.mp3")
response = client.models.generate_content(
model="gemini-2.0-flash", contents=["Describe this audio clip", myfile]
)
print(response.text)
জাভাস্ক্রিপ্ট
import {
GoogleGenAI,
createUserContent,
createPartFromUri,
} from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const myfile = await ai.files.upload({
file: "path/to/sample.mp3",
config: { mimeType: "audio/mpeg" },
});
const response = await ai.models.generateContent({
model: "gemini-2.0-flash",
contents: createUserContent([
createPartFromUri(myfile.uri, myfile.mimeType),
"Describe this audio clip",
]),
});
console.log(response.text);
}
await main();
যাও
file, err := client.UploadFileFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)
model := client.GenerativeModel("gemini-2.0-flash")
resp, err := model.GenerateContent(ctx,
genai.FileData{URI: file.URI},
genai.Text("Describe this audio clip"))
if err != nil {
log.Fatal(err)
}
printResponse(resp)
বিশ্রাম
AUDIO_PATH="path/to/sample.mp3"
MIME_TYPE=$(file -b --mime-type "${AUDIO_PATH}")
NUM_BYTES=$(wc -c < "${AUDIO_PATH}")
DISPLAY_NAME=AUDIO
tmp_header_file=upload-header.tmp
# Initial resumable request defining metadata.
# The upload url is in the response headers dump them to a file.
curl "${BASE_URL}/upload/v1beta/files?key=${GOOGLE_API_KEY}" \
-D upload-header.tmp \
-H "X-Goog-Upload-Protocol: resumable" \
-H "X-Goog-Upload-Command: start" \
-H "X-Goog-Upload-Header-Content-Length: ${NUM_BYTES}" \
-H "X-Goog-Upload-Header-Content-Type: ${MIME_TYPE}" \
-H "Content-Type: application/json" \
-d "{'file': {'display_name': '${DISPLAY_NAME}'}}" 2> /dev/null
upload_url=$(grep -i "x-goog-upload-url: " "${tmp_header_file}" | cut -d" " -f2 | tr -d "\r")
rm "${tmp_header_file}"
# Upload the actual bytes.
curl "${upload_url}" \
-H "Content-Length: ${NUM_BYTES}" \
-H "X-Goog-Upload-Offset: 0" \
-H "X-Goog-Upload-Command: upload, finalize" \
--data-binary "@${AUDIO_PATH}" 2> /dev/null > file_info.json
file_uri=$(jq ".file.uri" file_info.json)
echo file_uri=$file_uri
# Now generate content using that file
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[
{"text": "Describe this audio clip"},
{"file_data":{"mime_type": "${MIME_TYPE}", "file_uri": '$file_uri'}}]
}]
}' 2> /dev/null > response.json
cat response.json
echo
jq ".candidates[].content.parts[].text" response.json
একটি ফাইলের জন্য মেটাডেটা পান
আপনি যাচাই করতে পারেন যে API সফলভাবে আপলোড করা ফাইলটি সংরক্ষণ করেছে এবং files.get
এ কল করে এর মেটাডেটা পেতে পারে।
পাইথন
myfile = client.files.upload(file='path/to/sample.mp3')
file_name = myfile.name
myfile = client.files.get(name=file_name)
print(myfile)
জাভাস্ক্রিপ্ট
const myfile = await ai.files.upload({
file: "path/to/sample.mp3",
config: { mimeType: "audio/mpeg" },
});
const fileName = myfile.name;
const fetchedFile = await ai.files.get({ name: fileName });
console.log(fetchedFile);
যাও
file, err := client.UploadFileFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
log.Fatal(err)
}
gotFile, err := client.GetFile(ctx, file.Name)
if err != nil {
log.Fatal(err)
}
fmt.Println("Got file:", gotFile.Name)
বিশ্রাম
# file_info.json was created in the upload example
name=$(jq ".file.name" file_info.json)
# Get the file of interest to check state
curl https://generativelanguage.googleapis.com/v1beta/files/$name > file_info.json
# Print some information about the file you got
name=$(jq ".file.name" file_info.json)
echo name=$name
file_uri=$(jq ".file.uri" file_info.json)
echo file_uri=$file_uri
আপলোড করা ফাইলের তালিকা করুন
আপনি Files API ব্যবহার করে একাধিক ফাইল আপলোড করতে পারেন। নিম্নলিখিত কোডটি আপলোড করা সমস্ত ফাইলের একটি তালিকা পায়:
পাইথন
print('My files:')
for f in client.files.list():
print(' ', f.name)
জাভাস্ক্রিপ্ট
const listResponse = await ai.files.list({ config: { pageSize: 10 } });
for await (const file of listResponse) {
console.log(file.name);
}
যাও
iter := client.ListFiles(ctx)
for {
ifile, err := iter.Next()
if err == iterator.Done {
break
}
if err != nil {
log.Fatal(err)
}
fmt.Println(ifile.Name)
}
বিশ্রাম
echo "My files: "
curl "https://generativelanguage.googleapis.com/v1beta/files?key=$GOOGLE_API_KEY"
আপলোড করা ফাইল মুছুন
ফাইলগুলি 48 ঘন্টা পরে স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়। আপনি নিজেও একটি আপলোড করা ফাইল মুছতে পারেন:
পাইথন
myfile = client.files.upload(file='path/to/sample.mp3')
client.files.delete(name=myfile.name)
জাভাস্ক্রিপ্ট
const myfile = await ai.files.upload({
file: "path/to/sample.mp3",
config: { mimeType: "audio/mpeg" },
});
const fileName = myfile.name;
await ai.files.delete({ name: fileName });
যাও
file, err := client.UploadFileFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
log.Fatal(err)
}
client.DeleteFile(ctx, file.Name)
বিশ্রাম
curl --request "DELETE" https://generativelanguage.googleapis.com/v1beta/files/$name?key=$GOOGLE_API_KEY
ব্যবহারের তথ্য
আপনি মিডিয়া ফাইল আপলোড করতে এবং ইন্টারঅ্যাক্ট করতে Files API ব্যবহার করতে পারেন। ফাইল এপিআই আপনাকে প্রতি প্রোজেক্টে 20 GB পর্যন্ত ফাইল সংরক্ষণ করতে দেয়, যার প্রতি ফাইলের সর্বোচ্চ আকার 2 GB। ফাইল 48 ঘন্টার জন্য সংরক্ষণ করা হয়. সেই সময়ের মধ্যে, আপনি ফাইলগুলি সম্পর্কে মেটাডেটা পেতে API ব্যবহার করতে পারেন, কিন্তু আপনি ফাইলগুলি ডাউনলোড করতে পারবেন না। Gemini API পাওয়া যায় এমন সমস্ত অঞ্চলে Files API বিনা মূল্যে উপলব্ধ।
ফাইল প্রম্পটিং কৌশল
এই বিভাগটি Gemini API-এর জন্য প্রম্পট সহ মিডিয়া ফাইলগুলি ব্যবহার করার জন্য নির্দেশিকা এবং সর্বোত্তম অনুশীলন প্রদান করে।
আপনার প্রম্পটে বিভিন্ন ধরণের ডেটা ব্যবহার করতে সক্ষম হওয়ার ফলে আপনি জেমিনি API এর সাথে কোন কাজগুলি মোকাবেলা করতে পারেন তার পরিপ্রেক্ষিতে আপনাকে আরও নমনীয়তা দেয়৷ উদাহরণস্বরূপ, আপনি মডেলটিকে একটি সুস্বাদু খাবারের একটি ফটো পাঠাতে পারেন এবং খাবার সম্পর্কে একটি ছোট ব্লগ লিখতে বলতে পারেন।
প্রম্পট | প্রতিক্রিয়া |
এই ছবির উপর ভিত্তি করে একটি ছোট, আকর্ষক ব্লগ পোস্ট লিখুন। এটি ফটোতে খাবারের একটি বিবরণ অন্তর্ভুক্ত করা উচিত এবং আমার ভ্রমণের খাবার প্রস্তুত করার বিষয়ে কথা বলা উচিত। ![]() | খাবার প্রস্তুত করা সময় এবং অর্থ সাশ্রয়ের একটি দুর্দান্ত উপায় এবং এটি আপনাকে স্বাস্থ্যকর খেতেও সহায়তা করতে পারে। এই খাবারটি একটি স্বাস্থ্যকর এবং সুস্বাদু খাবারের একটি দুর্দান্ত উদাহরণ যা সময়ের আগে সহজেই প্রস্তুত করা যেতে পারে। এই খাবারে বাদামী চাল, ভাজা সবজি এবং চিকেন তেরিয়াকি রয়েছে। বাদামী চাল একটি স্বাস্থ্যকর এবং জটিল কার্বোহাইড্রেট যা আপনাকে টেকসই শক্তি দেবে। রোস্ট করা শাকসবজি হল আপনার প্রতিদিনের ভিটামিন এবং মিনারেলের ডোজ পাওয়ার একটি দুর্দান্ত উপায় এবং চিকেন তেরিয়াকি একটি সুস্বাদু এবং প্রোটিন সমৃদ্ধ বিকল্প। এই খাবারটি প্রস্তুত করাও খুব সহজ। সহজভাবে বাদামী চাল রান্না করুন, সবজি ভাজুন এবং চিকেন তেরিয়াকি রান্না করুন। একবার সবকিছু রান্না হয়ে গেলে, খাবারের প্রস্তুতির পাত্রে ভাগ করে ফ্রিজে সংরক্ষণ করুন। তারপর আপনি একটি ধারক দখল এবং ব্যস্ত সকালে যেতে পারেন! আপনি যদি একটি স্বাস্থ্যকর এবং সুস্বাদু খাবার খুঁজছেন যা সহজেই সময়ের আগে প্রস্তুত করা যেতে পারে, এই খাবারটি একটি দুর্দান্ত বিকল্প। এটি পুষ্টি এবং গন্ধে পরিপূর্ণ, এবং এটি আপনাকে পূর্ণ এবং সন্তুষ্ট বোধ করবে তা নিশ্চিত। এখানে স্বাস্থ্যকর এবং সুস্বাদু খাবারের প্রস্তুতি রয়েছে! |
মিডিয়া ফাইলগুলি ব্যবহার করে এমন প্রম্পটগুলি থেকে আপনি যে আউটপুটটি চান তা পেতে যদি আপনার সমস্যা হয় তবে কিছু কৌশল রয়েছে যা আপনাকে আপনার পছন্দের ফলাফল পেতে সহায়তা করতে পারে। নিম্নলিখিত বিভাগগুলি মাল্টিমোডাল ইনপুট ব্যবহার করে এমন প্রম্পটগুলিকে উন্নত করার জন্য নকশা পদ্ধতি এবং সমস্যা সমাধানের টিপস প্রদান করে।
আপনি এই সেরা অনুশীলনগুলি অনুসরণ করে আপনার মাল্টিমোডাল প্রম্পটগুলিকে উন্নত করতে পারেন:
প্রম্পট নকশা মৌলিক
- আপনার নির্দেশাবলীতে সুনির্দিষ্ট হোন : পরিষ্কার এবং সংক্ষিপ্ত নির্দেশনা তৈরি করুন যা ভুল ব্যাখ্যার জন্য ন্যূনতম জায়গা ছেড়ে দেয়।
- আপনার প্রম্পটে কয়েকটি উদাহরণ যোগ করুন: আপনি কী অর্জন করতে চান তা বোঝাতে বাস্তবসম্মত কয়েকটি শট উদাহরণ ব্যবহার করুন।
- ধাপে ধাপে এটি ভেঙে ফেলুন : জটিল কাজগুলিকে পরিচালনাযোগ্য উপ-লক্ষ্যে বিভক্ত করুন, প্রক্রিয়াটির মাধ্যমে মডেলটিকে গাইড করুন।
- আউটপুট ফরম্যাটটি নির্দিষ্ট করুন : আপনার প্রম্পটে, মার্কডাউন, JSON, এইচটিএমএল এবং আরও অনেক কিছুর মতো আউটপুট আপনার পছন্দ মতো ফর্ম্যাটে হতে বলুন।
- সিঙ্গেল-ইমেজ প্রম্পটের জন্য আপনার ইমেজকে প্রথমে রাখুন : যদিও মিথুন যেকোন ক্রমে ইমেজ এবং টেক্সট ইনপুট পরিচালনা করতে পারে, একটি একক ইমেজ সম্বলিত প্রম্পটের জন্য, যদি সেই ছবি (বা ভিডিও) টেক্সট প্রম্পটের আগে রাখা হয় তাহলে এটি আরও ভাল পারফর্ম করতে পারে। যাইহোক, যে প্রম্পটগুলির জন্য ইমেজগুলিকে অর্থপূর্ণ করার জন্য পাঠ্যের সাথে উচ্চতরভাবে আন্তঃলিভ করা প্রয়োজন, সেগুলি ব্যবহার করুন যা সবচেয়ে স্বাভাবিক।
আপনার মাল্টিমোডাল প্রম্পটের সমস্যা সমাধান করা হচ্ছে
- যদি মডেলটি ছবির প্রাসঙ্গিক অংশ থেকে তথ্য আঁকতে না পারে: ইমেজটির কোন দিক দিয়ে আপনি প্রম্পটটি থেকে তথ্য আঁকতে চান তা নির্দেশ করুন।
- যদি মডেলের আউটপুট খুব সাধারণ হয় (ছবি/ভিডিও ইনপুটের জন্য যথেষ্ট মানানসই নয়): প্রম্পটের শুরুতে, টাস্ক নির্দেশ দেওয়ার আগে মডেলটিকে চিত্র(গুলি) বা ভিডিও বর্ণনা করতে বলার চেষ্টা করুন, অথবা ছবিতে যা আছে তা উল্লেখ করতে মডেলকে বলার চেষ্টা করুন৷
- কোন অংশটি ব্যর্থ হয়েছে তা সমাধান করতে: মডেলটিকে চিত্রটি বর্ণনা করতে বলুন, অথবা মডেলটিকে তার যুক্তি ব্যাখ্যা করতে বলুন, মডেলটির প্রাথমিক বোঝার পরিমাপ করতে৷
- যদি আপনার প্রম্পটের ফলে হ্যালুসিনেটেড সামগ্রী হয়: তাপমাত্রা সেটিং ডায়াল করার চেষ্টা করুন বা মডেলটিকে সংক্ষিপ্ত বিবরণের জন্য জিজ্ঞাসা করুন যাতে এটি অতিরিক্ত বিবরণ এক্সট্রাপোলেট করার সম্ভাবনা কম থাকে।
- স্যাম্পলিং প্যারামিটারগুলি টিউন করা: মডেলের সৃজনশীলতা সামঞ্জস্য করতে বিভিন্ন তাপমাত্রা সেটিংস এবং শীর্ষ-কে নির্বাচনের সাথে পরীক্ষা করুন৷
আপনার নির্দেশাবলী সুনির্দিষ্ট হন
প্রম্পটগুলি সবচেয়ে সফল হয় যখন সেগুলি পরিষ্কার এবং বিস্তারিত হয়। আপনার মনে একটি নির্দিষ্ট আউটপুট থাকলে, আপনি যে আউটপুট চান তা নিশ্চিত করতে প্রম্পটে সেই প্রয়োজনীয়তাটি অন্তর্ভুক্ত করা ভাল।
একটি বিমানবন্দর বোর্ডের এই চিত্রটির জন্য, মডেলটিকে শুধুমাত্র "এই চিত্রটি বর্ণনা করতে" বলা একটি সাধারণ বিবরণ তৈরি করতে পারে৷ আপনার যদি চিত্র থেকে সময় এবং শহর বিশ্লেষণ করার জন্য মডেলটির প্রয়োজন হয়, আপনি সরাসরি আপনার প্রম্পটে সেই অনুরোধটি অন্তর্ভুক্ত করতে পারেন।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() এই চিত্রটি বর্ণনা করুন। | ছবিটি বিমানবন্দরে আগমন এবং প্রস্থান বোর্ড দেখায়। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]() একটি তালিকায় এই ছবিতে দেখানো বিমানবন্দর বোর্ড থেকে সময় এবং শহর পার্স করুন। |
কয়েকটি উদাহরণ যোগ করুন
জেমিনি মডেল একাধিক ইনপুট গ্রহণ করতে পারে যা এটি আপনার পছন্দের আউটপুট বোঝার জন্য উদাহরণ হিসাবে ব্যবহার করতে পারে। এই উদাহরণগুলি যোগ করা মডেলটিকে নিদর্শনগুলি সনাক্ত করতে এবং প্রদত্ত চিত্র এবং নতুন উদাহরণের প্রতিক্রিয়াগুলির মধ্যে সম্পর্ক প্রয়োগ করতে সহায়তা করতে পারে। এটিকে "কয়েক-শট" শেখারও বলা হয়।
নীচের উদাহরণে, প্রাথমিক আউটপুট বাক্য আকারে লেখা হয়েছে এবং এতে দেশ (ব্রাজিল)ও রয়েছে। ধরুন আপনি একটি ভিন্ন বিন্যাস বা শৈলীতে আউটপুট চান, এবং আপনি শুধুমাত্র শহর চান, দেশ নয়। আপনার প্রম্পটে কয়েকটি শট উদাহরণ যোগ করলে মডেলটিকে আপনি যেভাবে চান সেভাবে সাড়া দিতে পারে।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() ল্যান্ডমার্ক সহ শহর নির্ধারণ করুন। | ল্যান্ডমার্ক হল ব্রাজিলের রিও ডি জেনিরোতে ক্রাইস্ট দ্য রিডিমার মূর্তি। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
ল্যান্ডমার্ক সহ শহর নির্ধারণ করুন। ![]() | শহর: রোম, ল্যান্ডমার্ক: কলোসিয়াম। |
![]() | শহর: বেইজিং, ল্যান্ডমার্ক: নিষিদ্ধ শহর |
![]() | শহর: রিও ডি জেনিরো, ল্যান্ডমার্ক: ক্রাইস্ট দ্য রিডিমার মূর্তি |
ধাপে ধাপে এটি ভেঙে ফেলুন
জটিল কাজগুলির জন্য যেগুলির জন্য চাক্ষুষ বোঝার এবং যুক্তি উভয়েরই প্রয়োজন, কাজটিকে আরও ছোট, আরও সরল ধাপে ভাগ করা সহায়ক হতে পারে। বিকল্পভাবে, এটি কার্যকর হতে পারে যদি আপনি সরাসরি মডেলটিকে আপনার প্রম্পটে "ধাপে ধাপে চিন্তা করতে" বলেন।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() কখন আমার টয়লেট পেপার ফুরিয়ে যাবে? | শীঘ্রই, আপনার কাছে মাত্র 3টি রোল বাকি আছে। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]()
|
|
গণিত সমস্যা বা অন্যান্য ধরণের শব্দ সমস্যাগুলি মডেলকে ধাপে ধাপে চিন্তা করতে বলার জন্য দুর্দান্ত প্রার্থী।
প্রম্পট | প্রতিক্রিয়া |
---|---|
![]() অনুক্রমের ৪র্থ পদ কি? | -135 |
মডেল থেকে প্রতিক্রিয়া ভুল. এটি উন্নত করার কিছু উপায় হল প্রম্পটের উত্তর দেওয়ার আগে মডেলটিকে সমস্যাটি পার্স করতে বলা।
প্রম্পট | প্রতিক্রিয়া |
---|---|
![]() প্রথমে ছবিতে সূত্রটি পার্স করুন। তারপর সূত্রের উপর ভিত্তি করে, উত্তর দিন "ক্রমের 4র্থ পদটি কী?"। | ফলাফল প্রসারিত করতে ক্লিক করুন\( b(n) = b(n-1) * (-3) \) \( b(1) = 15 \)
\( b(4) = b(4-1) * (-3) \) \( b(4) = b(3) * (-3) \) \( b(3) = b(3-1) * (-3) \) \( b(3) = b(2) * (-3) \) \( b(2) = b(2-1) * (-3) \) \( b(2) = b(1) * (-3) \) \( b(2) = 15 * (-3) \) \( b(2) = -45 \) \( b(3) = b(2) * (-3) \) \( b(3) = -45 * (-3) \) \( b(3) = 135 \) \( b(4) = b(3) * (-3) \) \( b(4) = 135 * (-3) \) \( b(4) = -405 \) অতএব, অনুক্রমের 4র্থ পদটি হল -405। |
এই মডেলের প্রতিক্রিয়াটি সঠিক - এখন প্রতিক্রিয়াটিকে আরও সুগম করতে, আপনি মডেলটিকে ধাপে ধাপে চিন্তা করতে বলতে পারেন৷
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]() অনুক্রমের ৪র্থ পদ কি? ধাপে ধাপে চিন্তা করুন। | প্রথম মেয়াদ 15। দ্বিতীয় পদটি হল b(1) * (-3) = 15 * (-3) = -45। তৃতীয় পদটি হল b(2) * (-3) = -45 * (-3) = 135। চতুর্থ পদটি হল b(3) * (-3) = 135 * (-3) = -405। |
আউটপুট বিন্যাস উল্লেখ করুন
একটি সাধারণ সমস্যা হল মডেল আউটপুট একটি নির্দিষ্ট বিন্যাসে (যেমন মার্কডাউন, JSON, এইচটিএমএল) হওয়া প্রয়োজন, বিশেষ করে যদি মডেল আউটপুটটি একটি ডাউনস্ট্রিম টাস্ক দ্বারা ইনজেস্ট করা প্রয়োজন। আপনি মডেলটিকে প্রম্পটের মধ্যে এটি করার নির্দেশ দিয়ে সেই বিন্যাসে আউটপুট তৈরি করার চেষ্টা করতে পারেন। নীচে দুটি উদাহরণ দেওয়া হল:
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() মার্কডাউন বিন্যাসে এই চিত্রের টেবিলটি পার্স করুন | | বিষয় | স্ট্যাটাস | সময় | শুরুর তারিখ | বাকি আছে | | ------- | ------ | ---- | --------- | ------ | | গণিত | সম্পন্ন | 1.5 ঘন্টা | 11/29/2023 | 12/1/2023 | | ভূগোল | সম্পন্ন | 30 মিনিট | 12/2/2023 | 12/4/2023 | | পদার্থবিদ্যা | চলছে | 2 ঘন্টা | 12/3/2023 | 12/5/2023 | | জীববিদ্যা | শুরু হয়নি | 6 ঘন্টা | 11/2/2016 | 12/6/2023 | |
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() নিম্নলিখিত সমস্ত বৈশিষ্ট্যগুলির একটি তালিকা প্রদান করুন: উপাদান, রান্নার ধরন, নিরামিষ বা না, JSON ফর্ম্যাটে | ``জসন`` { "উপাদান": [ "ভাত", "চিংড়ি", "ক্ল্যামস", "ঝিনুক", "মটর" "টমেটো", "পেঁয়াজ", "রসুন", "জলপাই তেল", "পাপরিকা", "লবণ", "মরিচ" ], "রোজগারের প্রকার": "স্প্যানিশ", "নিরামিষাশী": মিথ্যা |
একক-ইমেজ প্রম্পটগুলির জন্য আপনার ছবিটি প্রথমে রাখুন
যদিও মিথুন একটি প্রম্পটের মধ্যে যেকোনো ক্রমে ছবি এবং পাঠ্যকে ব্যাখ্যা করতে পারে, টেক্সট প্রম্পটের আগে একটি একক ছবি রাখলে ভালো ফলাফল হতে পারে। নিম্নলিখিত নমুনাগুলিতে, আপনি লক্ষ্য করবেন প্রতিটি প্রম্পটে পাঠ্যের আগে চিত্রটি প্রথমে আসে।
আপনার মাল্টিমোডাল প্রম্পটের সমস্যা সমাধান করা হচ্ছে
আপনি একটি সহায়ক প্রতিক্রিয়া না পেলে আপনার প্রম্পটের সমস্যা সমাধানের প্রয়োজন হতে পারে। এখানে কয়েকটি কৌশল রয়েছে যা আপনি চেষ্টা করতে পারেন।
যদি মডেলটি ছবির প্রাসঙ্গিক অংশ থেকে তথ্য আঁকতে না পারে
আরও সুনির্দিষ্ট প্রতিক্রিয়া পেতে, আপনি নির্দেশ করতে পারেন যে চিত্রটির প্রতিক্রিয়া জানাতে আপনি প্রম্পট থেকে তথ্য আঁকতে চান তার কোন দিকগুলি।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() কত দিন এই ডায়াপার একটি শিশুর চলবে? | ডায়াপার ফুরিয়ে যাওয়ার আগে 198 দিন ধরে চলবে। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]() আমি ফুরিয়ে যাবার আগে এই ডায়াপারগুলো কতক্ষণ চলবে? বাচ্চার বয়স নির্ধারণ করতে বাক্সে দেখানো ওজন ব্যবহার করুন এবং বাক্সে মোট ডায়াপারের সংখ্যা ব্যবহার করুন। শিশু প্রতিদিন কতগুলি ডায়াপারের মধ্য দিয়ে যায় তার দ্বারা মোট সংখ্যাকে ভাগ করুন। | বাক্সে 198টি ডায়াপার রয়েছে। বাক্সে বলা হয়েছে যে ডায়াপারগুলি 22-37 পাউন্ড ওজনের একটি শিশুর জন্য। এই ওজন সীমার মধ্যে গড় শিশুর বয়স সম্ভবত 1 থেকে 2 বছরের মধ্যে। একজন 2 বছর বয়সী সাধারণত প্রতিদিন 6 টি ডায়াপারের মধ্য দিয়ে যায়, তাই, ডায়াপার প্রায় 33 দিন (198/6) স্থায়ী হয়। |
যদি মডেলের আউটপুট খুব জেনেরিক হয় এবং ইমেজ ইনপুটের জন্য যথেষ্ট উপযোগী না হয়
মডেলটিকে চিত্র(গুলি) এর প্রতি তার প্রতিক্রিয়া তৈরি করতে সাহায্য করার জন্য, এটির যুক্তির কাজটি সম্পাদন করার আগে চিত্রগুলি বর্ণনা করতে বলার চেষ্টা করুন৷
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() ![]() ![]() ![]() এই ইমেজ মধ্যে সাধারণ কি? | চারটি ছবিই ল্যান্ডস্কেপ ফটোগ্রাফির উদাহরণ। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]() ![]() ![]() ![]() প্রথমে, প্রতিটি ছবিতে কী আছে তা বিস্তারিতভাবে বর্ণনা করুন। এই ইমেজ মধ্যে সাধারণ কি? | প্রথম ছবিতে দেখা যাচ্ছে একজন ব্যক্তি একটি স্যুটকেস প্যাক করছেন৷ দ্বিতীয় ছবিটি একটি শপিং মলে একটি খালি হলওয়ে দেখায়। তৃতীয় ছবিটি টয়লেট পেপারের একটি রোল দেখায়। চতুর্থ চিত্রটি একটি অন্ধকার এবং ঝড়ো সমুদ্র দেখায়। এই চিত্রগুলির মধ্যে সাধারণতা হল যে এগুলি সমস্ত সীমাবদ্ধ স্থানগুলির উদাহরণ৷ লিমিনাল স্পেসগুলি এমন স্থান বা পরিস্থিতি যা দুটি অন্য স্থান বা পরিস্থিতির মধ্যে থাকে। এগুলি প্রায়শই অনিশ্চয়তা বা অস্পষ্টতার অনুভূতি দ্বারা চিহ্নিত করা হয়। প্রথম চিত্রটি বাড়িতে থাকা এবং ভ্রমণে থাকা মাঝখানে ব্যক্তিটিকে দেখায়৷ দ্বিতীয় ছবিটি দুটি দোকানের মধ্যে হলওয়ে দেখায়। তৃতীয় ছবিটি টয়লেট পেপারের, যা একটি বাথরুমের প্রতিনিধিত্ব করতে পারে। একটি বাথরুম ব্যক্তিগত এবং পাবলিক অঞ্চলের মধ্যে একটি ক্রান্তিকালীন স্থান। এটি এমন একটি জায়গা যেখানে আমরা বাইরের জগতে প্রবেশ বা ছেড়ে যাওয়ার জন্য নিজেদের প্রস্তুত করি। চতুর্থ চিত্রটি শান্ত এবং ঝড়ো হওয়ার মধ্যে সমুদ্র দেখায়। লিমিনাল স্পেসগুলি উত্তেজনাপূর্ণ এবং অস্থির উভয়ই হতে পারে। এগুলি নতুন শুরুর জায়গা বা শেষের জায়গা হতে পারে। তারা প্রতিফলনের জায়গা বা কর্মের জায়গা হতে পারে। |
এছাড়াও আপনি ছবিতে যা আছে তা উল্লেখ করতে মডেলটিকে স্পষ্টভাবে বলার চেষ্টা করতে পারেন।
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]() ![]() ![]() ![]() এই ইমেজ মধ্যে সাধারণ কি? আপনার প্রতিক্রিয়াতে চিত্রগুলিতে কী আছে তা পড়ুন। | সব ছবিই ভ্রমণ সম্পর্কিত। প্রথম চিত্রটিতে একজন ব্যক্তিকে একটি স্যুটকেস প্যাক করছেন, দ্বিতীয় চিত্রটি একটি শপিং মলে একটি খালি হলওয়ে দেখায়, তৃতীয় চিত্রটি টয়লেট পেপারের স্তুপ দেখায় এবং চতুর্থ চিত্রটি একটি অন্ধকার এবং ঝড়ো সমুদ্র দেখায়৷ এই চিত্রগুলি সমস্ত ভ্রমণের সাথে সম্পর্কিত কারণ এগুলি এমন সমস্ত জিনিস যা লোকেরা ভ্রমণের সময় প্রয়োজন বা ব্যবহার করে৷ প্রথম ছবিতে দেখা যাচ্ছে একজন ব্যক্তি একটি স্যুটকেস প্যাক করছেন, যেটি এমন কিছু যা তারা যখন ভ্রমণে যায় তখন তারা করে। দ্বিতীয় চিত্রটি একটি শপিং মলের একটি খালি হলওয়ে দেখায়, এটি এমন একটি জায়গা যেখানে লোকেরা প্রায়শই তাদের ভ্রমণের জন্য জিনিস কিনতে যায়। তৃতীয় চিত্রটি টয়লেট পেপারের একটি স্তুপ দেখায়, যা এমন কিছু যা লোকেরা প্রায়শই ভ্রমণ করার সময় ব্যবহার করে। চতুর্থ চিত্রটি একটি অন্ধকার এবং ঝড়ো সমুদ্র দেখায়, যা এমন কিছু যা লোকেরা প্রায়ই ভ্রমণ করার সময় সম্মুখীন হয়। |
একই টিপস ইমেজ থেকে সৃজনশীল আউটপুট জন্য কাজ করে. খরগোশের সাথে নিম্নলিখিত উদাহরণে, মডেলটিকে স্পষ্টভাবে চিত্রের দিকগুলি অন্তর্ভুক্ত করতে বলা আউটপুটকে উন্নত করতে পারে।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
![]() আপনি কি আমাকে এই ছবিটি সম্পর্কে একটি কবিতা লিখতে পারেন? | ছোট খরগোশ, এত নরম এবং বাদামী, তুমি ঘাসের উপর চটকাও, এত সবুজ এবং মিষ্টি, |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
![]() আপনি কি আমাকে এই চিত্র সম্পর্কে একটি বর্ণনামূলক এবং নাটকীয় কবিতা লিখতে পারেন এবং অবস্থান অন্তর্ভুক্ত করতে পারেন? | সবুজের উপর ছোট খরগোশ, এটা কি সাগর নীল, ছোট খরগোশ, সত্যি করে বলো, সম্ভবত এটি সমস্ত কিছুর বিশালতা, ছোট খরগোশ, আমি ভাবছি তুমি কি স্বপ্ন দেখো, যাই হোক না কেন, ছোট খরগোশ, |
প্রম্পটের কোন অংশ ব্যর্থ হয়েছে তার সমস্যা সমাধান করা হচ্ছে
একটি প্রম্পট ব্যর্থ হয়েছে কিনা তা জানা কঠিন হতে পারে কারণ মডেলটি যে ছবিটি দিয়ে শুরু করতে হবে তা বুঝতে পারেনি, অথবা যদি এটি চিত্রটি বুঝতে পারে তবে পরে সঠিক যুক্তি পদক্ষেপগুলি সম্পাদন করেনি। এই কারণগুলির মধ্যে দ্ব্যর্থতা জানাতে, ছবিতে কী আছে তা বর্ণনা করতে মডেলটিকে বলুন৷
নিম্নলিখিত উদাহরণে, মডেলটি যদি চা (যেমন পপকর্ন) এর সাথে জুটি বাঁধার সময় আশ্চর্যজনক বলে মনে হয় এমন একটি জলখাবার দিয়ে প্রতিক্রিয়া জানায়, তাহলে আপনি প্রথমে মডেলটি সঠিকভাবে চিনতে পেরেছেন যে ছবিতে চা রয়েছে কিনা তা নির্ধারণ করতে পারেন৷
প্রম্পট | সমস্যা সমাধানের জন্য অনুরোধ করুন |
---|---|
![]() আমি 1 মিনিটের মধ্যে কি একটি জলখাবার তৈরি করতে পারি যা এটির সাথে ভাল হবে? | ![]() এই ছবিতে কি আছে তা বর্ণনা করুন। |
আরেকটি কৌশল হল মডেলকে তার যুক্তি ব্যাখ্যা করতে বলা। এটি আপনাকে যুক্তির কোন অংশটি ভেঙেছে তা সংকুচিত করতে সাহায্য করতে পারে, যদি থাকে।
প্রম্পট | সমস্যা সমাধানের জন্য অনুরোধ করুন |
---|---|
![]() আমি 1 মিনিটের মধ্যে কি একটি জলখাবার তৈরি করতে পারি যা এটির সাথে ভাল হবে? | ![]() আমি 1 মিনিটের মধ্যে কি একটি জলখাবার তৈরি করতে পারি যা এটির সাথে ভাল হবে? কেন ব্যাখ্যা করুন. |
এরপর কি
- Google AI Studio ব্যবহার করে আপনার নিজস্ব মাল্টিমোডাল প্রম্পট লেখার চেষ্টা করুন।
- মিডিয়া ফাইল আপলোড করার জন্য এবং আপনার প্রম্পটে সেগুলি অন্তর্ভুক্ত করার জন্য Gemini Files API ব্যবহার করার বিষয়ে তথ্যের জন্য, ভিশন , অডিও , এবং ডকুমেন্ট প্রসেসিং গাইড দেখুন৷
- নমুনা প্যারামিটার টিউন করার মত প্রম্পট ডিজাইনের বিষয়ে আরও নির্দেশনার জন্য, প্রম্পট কৌশল পৃষ্ঠাটি দেখুন।