জেমিনি ৩ হল আমাদের এখন পর্যন্ত সবচেয়ে বুদ্ধিমান মডেল পরিবার, যা অত্যাধুনিক যুক্তির ভিত্তির উপর নির্মিত। এটি এজেন্টিক ওয়ার্কফ্লো, স্বায়ত্তশাসিত কোডিং এবং জটিল মাল্টিমোডাল কাজগুলিতে দক্ষতা অর্জনের মাধ্যমে যেকোনো ধারণাকে বাস্তবে রূপ দেওয়ার জন্য ডিজাইন করা হয়েছে। এই নির্দেশিকাটিতে জেমিনি ৩ মডেল পরিবারের মূল বৈশিষ্ট্যগুলি এবং কীভাবে এটি থেকে সর্বাধিক সুবিধা অর্জন করা যায় তা আলোচনা করা হয়েছে।
জেমিনি ৩ প্রো প্রম্পটের মাধ্যমে যুক্তি করার জন্য ডিফল্টভাবে গতিশীল চিন্তাভাবনা ব্যবহার করে। জটিল যুক্তির প্রয়োজন না হলে দ্রুত, কম-বিলম্বিত প্রতিক্রিয়ার জন্য, আপনি মডেলের চিন্তাভাবনার স্তরকে low সীমাবদ্ধ করতে পারেন।
পাইথন
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="Find the race condition in this multi-threaded C++ snippet: [code here]",
)
print(response.text)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function run() {
const response = await ai.models.generateContent({
model: "gemini-3-pro-preview",
contents="Find the race condition in this multi-threaded C++ snippet: [code here]",
});
console.log(response.text);
}
run();
বিশ্রাম
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts": [{"text": "Find the race condition in this multi-threaded C++ snippet: [code here]"}]
}]
}'
অন্বেষণ করুন

আমাদের জেমিনি ৩ অ্যাপের সংগ্রহ ঘুরে দেখুন এবং দেখুন কিভাবে মডেলটি উন্নত যুক্তি, স্বায়ত্তশাসিত কোডিং এবং জটিল মাল্টিমোডাল কাজগুলি পরিচালনা করে।
মিথুন ৩ এর সাথে দেখা করুন
জেমিনি ৩ প্রো হল নতুন সিরিজের প্রথম মডেল। gemini-3-pro-preview আপনার জটিল কাজের জন্য সবচেয়ে ভালো, যার জন্য বিস্তৃত বিশ্ব জ্ঞান এবং বিভিন্ন পদ্ধতিতে উন্নত যুক্তির প্রয়োজন।
| মডেল আইডি | প্রসঙ্গ উইন্ডো (ইন / আউট) | জ্ঞান সীমা | মূল্য নির্ধারণ (ইনপুট / আউটপুট)* |
|---|---|---|---|
| জেমিনি-৩-প্রো-প্রিভিউ | ১ মে / ৬৪ হাজার | জানুয়ারী ২০২৫ | $২ / $১২ (<২০০,০০০ টোকেন) $৪ / $১৮ (>২০০,০০০ টোকেন) |
| জেমিনি-৩-প্রো-ইমেজ-প্রিভিউ | ৬৫ হাজার / ৩২ হাজার | জানুয়ারী ২০২৫ | $২ (টেক্সট ইনপুট) / $০.১৩৪ (ছবি আউটপুট)** |
* অন্যথায় উল্লেখ না করা থাকলে প্রতি ১০ লক্ষ টোকেনের জন্য মূল্য নির্ধারণ করা হয়েছে। ** ছবির মূল্য রেজোলিউশন অনুসারে পরিবর্তিত হয়। বিস্তারিত জানার জন্য মূল্য পৃষ্ঠাটি দেখুন।
বিস্তারিত হারের সীমা, ব্যাচ মূল্য নির্ধারণ এবং অতিরিক্ত তথ্যের জন্য, মডেল পৃষ্ঠাটি দেখুন।
জেমিনি ৩-এ নতুন API বৈশিষ্ট্য
জেমিনি ৩ নতুন প্যারামিটার প্রবর্তন করেছে যা ডেভেলপারদের লেটেন্সি, খরচ এবং মাল্টিমোডাল বিশ্বস্ততার উপর আরও নিয়ন্ত্রণ দেওয়ার জন্য ডিজাইন করা হয়েছে।
চিন্তাভাবনার স্তর
thinking_level প্যারামিটারটি মডেলের অভ্যন্তরীণ যুক্তি প্রক্রিয়ার সর্বোচ্চ গভীরতা নিয়ন্ত্রণ করে, প্রতিক্রিয়া তৈরি করার আগে। Gemini 3 এই স্তরগুলিকে কঠোর টোকেন গ্যারান্টির পরিবর্তে চিন্তাভাবনার জন্য আপেক্ষিক ভাতা হিসাবে বিবেচনা করে। যদি thinking_level নির্দিষ্ট না করা থাকে, তাহলে Gemini 3 Pro ডিফল্টভাবে high এ চলে যাবে।
-
low: বিলম্ব এবং খরচ কমিয়ে দেয়। সহজ নির্দেশনা অনুসরণ, চ্যাট, অথবা উচ্চ-থ্রুপুট অ্যাপ্লিকেশনের জন্য সেরা -
medium: (শীঘ্রই আসছে), লঞ্চের সময় সমর্থিত নয় -
high(ডিফল্ট): যুক্তির গভীরতা সর্বাধিক করে তোলে। মডেলটি প্রথম টোকেনে পৌঁছাতে উল্লেখযোগ্যভাবে বেশি সময় নিতে পারে, তবে আউটপুট আরও সাবধানতার সাথে যুক্তিযুক্ত হবে।
মিডিয়া রেজোলিউশন
জেমিনি 3 media_resolution প্যারামিটারের মাধ্যমে মাল্টিমোডাল ভিশন প্রসেসিংয়ের উপর গ্রানুলার নিয়ন্ত্রণ প্রবর্তন করে। উচ্চ রেজোলিউশন মডেলের সূক্ষ্ম টেক্সট পড়ার বা ছোট বিবরণ সনাক্ত করার ক্ষমতা উন্নত করে, তবে টোকেনের ব্যবহার এবং ল্যাটেন্সি বৃদ্ধি করে। media_resolution প্যারামিটার প্রতি ইনপুট চিত্র বা ভিডিও ফ্রেমে বরাদ্দকৃত টোকেনের সর্বাধিক সংখ্যা নির্ধারণ করে।
আপনি এখন প্রতিটি মিডিয়া অংশের জন্য অথবা বিশ্বব্যাপী ( generation_config এর মাধ্যমে) রেজোলিউশনটি media_resolution_low , media_resolution_medium , অথবা media_resolution_high এ সেট করতে পারেন। যদি নির্দিষ্ট না করা থাকে, তাহলে মডেলটি মিডিয়া ধরণের উপর ভিত্তি করে সর্বোত্তম ডিফল্ট ব্যবহার করে।
প্রস্তাবিত সেটিংস
| মিডিয়া টাইপ | প্রস্তাবিত সেটিং | সর্বোচ্চ টোকেন | ব্যবহারের নির্দেশিকা |
|---|---|---|---|
| ছবি | media_resolution_high | ১১২০ | সর্বাধিক গুণমান নিশ্চিত করার জন্য বেশিরভাগ চিত্র বিশ্লেষণ কাজের জন্য প্রস্তাবিত। |
| পিডিএফ | media_resolution_medium | ৫৬০ | নথি বোঝার জন্য সর্বোত্তম; মান সাধারণত medium তাপমাত্রায় পরিপূর্ণ হয়। high স্তরে বৃদ্ধি করলে স্ট্যান্ডার্ড নথির জন্য OCR ফলাফল খুব কমই উন্নত হয়। |
| ভিডিও (সাধারণ) | media_resolution_low (অথবা media_resolution_medium ) | ৭০ (প্রতি ফ্রেমে) | দ্রষ্টব্য: ভিডিওর ক্ষেত্রে, প্রসঙ্গ ব্যবহার অপ্টিমাইজ করার জন্য low এবং medium সেটিংস একইভাবে (৭০টি টোকেন) ব্যবহার করা হয়। বেশিরভাগ অ্যাকশন শনাক্তকরণ এবং বর্ণনামূলক কাজের জন্য এটি যথেষ্ট। |
| ভিডিও (লেখার পরিধি বেশি) | media_resolution_high | ২৮০ (প্রতি ফ্রেমে) | শুধুমাত্র তখনই প্রয়োজন যখন ব্যবহারের ক্ষেত্রে ঘন টেক্সট (OCR) বা ভিডিও ফ্রেমের মধ্যে ছোট ছোট বিবরণ পড়া জড়িত থাকে। |
পাইথন
from google import genai
from google.genai import types
import base64
# The media_resolution parameter is currently only available in the v1alpha API version.
client = genai.Client(http_options={'api_version': 'v1alpha'})
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents=[
types.Content(
parts=[
types.Part(text="What is in this image?"),
types.Part(
inline_data=types.Blob(
mime_type="image/jpeg",
data=base64.b64decode("..."),
),
media_resolution={"level": "media_resolution_high"}
)
]
)
]
)
print(response.text)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from "@google/genai";
// The media_resolution parameter is currently only available in the v1alpha API version.
const ai = new GoogleGenAI({ apiVersion: "v1alpha" });
async function run() {
const response = await ai.models.generateContent({
model: "gemini-3-pro-preview",
contents: [
{
parts: [
{ text: "What is in this image?" },
{
inlineData: {
mimeType: "image/jpeg",
data: "...",
},
mediaResolution: {
level: "media_resolution_high"
}
}
]
}
]
});
console.log(response.text);
}
run();
বিশ্রাম
curl "https://generativelanguage.googleapis.com/v1alpha/models/gemini-3-pro-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts": [
{ "text": "What is in this image?" },
{
"inlineData": {
"mimeType": "image/jpeg",
"data": "..."
},
"mediaResolution": {
"level": "media_resolution_high"
}
}
]
}]
}'
তাপমাত্রা
জেমিনি ৩-এর জন্য, আমরা দৃঢ়ভাবে তাপমাত্রার প্যারামিটারটিকে তার ডিফল্ট মান 1.0 এ রাখার পরামর্শ দিচ্ছি।
পূর্ববর্তী মডেলগুলি প্রায়শই সৃজনশীলতা বনাম নির্ধারণবাদ নিয়ন্ত্রণের জন্য তাপমাত্রা টিউন করার সুবিধা পেয়েছিল, তবে জেমিনি 3 এর যুক্তি ক্ষমতাগুলি ডিফল্ট সেটিংসের জন্য অপ্টিমাইজ করা হয়েছে। তাপমাত্রা পরিবর্তন (এটি 1.0 এর নিচে সেট করা) অপ্রত্যাশিত আচরণের দিকে পরিচালিত করতে পারে, যেমন লুপিং বা কর্মক্ষমতা হ্রাস, বিশেষ করে জটিল গাণিতিক বা যুক্তির কাজে।
চিন্তার স্বাক্ষর
জেমিনি 3 API কলগুলিতে যুক্তির প্রেক্ষাপট বজায় রাখার জন্য চিন্তার স্বাক্ষর ব্যবহার করে। এই স্বাক্ষরগুলি মডেলের অভ্যন্তরীণ চিন্তা প্রক্রিয়ার এনক্রিপ্ট করা উপস্থাপনা। মডেলটি তার যুক্তির ক্ষমতা বজায় রাখে তা নিশ্চিত করার জন্য আপনাকে অবশ্যই এই স্বাক্ষরগুলি আপনার অনুরোধে মডেলে ঠিক যেভাবে গৃহীত হয়েছিল ঠিক সেইভাবে ফেরত পাঠাতে হবে:
- ফাংশন কলিং (কঠোর): API "কারেন্ট টার্ন"-এ কঠোর বৈধতা প্রয়োগ করে। স্বাক্ষর হারিয়ে গেলে 400 ত্রুটি দেখা দেবে।
- টেক্সট/চ্যাট: বৈধতা কঠোরভাবে প্রয়োগ করা হয় না, তবে স্বাক্ষর বাদ দিলে মডেলের যুক্তি এবং উত্তরের মান খারাপ হবে।
- ছবি তৈরি/সম্পাদনা (কঠোর) : API
thoughtSignatureসহ সকল মডেল অংশে কঠোর বৈধতা প্রয়োগ করে। স্বাক্ষর অনুপস্থিত থাকলে 400 ত্রুটি দেখা দেবে।
ফাংশন কলিং (কঠোর বৈধতা)
যখন জেমিনি একটি functionCall তৈরি করে, তখন পরবর্তী টার্নে টুলের আউটপুট সঠিকভাবে প্রক্রিয়া করার জন্য এটি thoughtSignature এর উপর নির্ভর করে। "Current Turn"-এ শেষ স্ট্যান্ডার্ড User text মেসেজ থেকে সংঘটিত সমস্ত Model ( functionCall ) এবং User ( functionResponse ) ধাপ অন্তর্ভুক্ত থাকে।
- একক ফাংশন কল:
functionCallঅংশে একটি স্বাক্ষর রয়েছে। আপনাকে এটি ফেরত দিতে হবে। - সমান্তরাল ফাংশন কল: তালিকার শুধুমাত্র প্রথম
functionCallঅংশে স্বাক্ষর থাকবে। আপনাকে অবশ্যই প্রাপ্ত ক্রমে অংশগুলি ফেরত দিতে হবে। - মাল্টি-স্টেপ (সিকুয়েনশিয়াল): যদি মডেলটি একটি টুল কল করে, ফলাফল পায় এবং অন্য একটি টুল কল করে (একই পালাক্রমে), তাহলে উভয় ফাংশন কলেই স্বাক্ষর থাকবে। আপনাকে ইতিহাসে জমা হওয়া সমস্ত স্বাক্ষর ফেরত দিতে হবে।
টেক্সট এবং স্ট্রিমিং
স্ট্যান্ডার্ড চ্যাট বা টেক্সট জেনারেশনের জন্য, স্বাক্ষরের উপস্থিতি নিশ্চিত নয়।
- নন-স্ট্রিমিং : প্রতিক্রিয়ার চূড়ান্ত বিষয়বস্তু অংশে একটি
thoughtSignatureথাকতে পারে, যদিও এটি সর্বদা উপস্থিত থাকে না। যদি একটি ফেরত দেওয়া হয়, তাহলে সর্বোত্তম কর্মক্ষমতা বজায় রাখার জন্য আপনার এটি ফেরত পাঠানো উচিত। - স্ট্রিমিং : যদি একটি স্বাক্ষর তৈরি করা হয়, তাহলে এটি একটি চূড়ান্ত অংশে আসতে পারে যার মধ্যে একটি খালি টেক্সট অংশ থাকবে। নিশ্চিত করুন যে আপনার স্ট্রিম পার্সার স্বাক্ষরের জন্য পরীক্ষা করছে, এমনকি যদি টেক্সট ফিল্ডটি খালি থাকে।
ছবি তৈরি এবং সম্পাদনা
gemini-3-pro-image-preview এর জন্য, কথোপকথন সম্পাদনার জন্য চিন্তার স্বাক্ষর অত্যন্ত গুরুত্বপূর্ণ। যখন আপনি মডেলটিকে একটি ছবি পরিবর্তন করতে বলেন, তখন এটি মূল ছবির গঠন এবং যুক্তি বোঝার জন্য পূর্ববর্তী পালা থেকে thoughtSignature উপর নির্ভর করে।
- সম্পাদনা: উত্তরের চিন্তাভাবনার পর প্রথম অংশে (
textঅথবাinlineData) এবং পরবর্তী প্রতিটিinlineDataঅংশে স্বাক্ষর নিশ্চিত করা হয়। ত্রুটি এড়াতে আপনাকে অবশ্যই এই সমস্ত স্বাক্ষর ফেরত দিতে হবে।
কোড উদাহরণ
মাল্টি-স্টেপ ফাংশন কলিং (ক্রমিক)
ব্যবহারকারী একটি প্রশ্ন জিজ্ঞাসা করেন যার জন্য এক পালায় দুটি পৃথক ধাপ (ফ্লাইট চেক -> ট্যাক্সি বুক করুন) প্রয়োজন।
ধাপ ১: মডেল ফ্লাইট টুলকে কল করে।
মডেলটি একটি স্বাক্ষর <Sig_A> প্রদান করে
// Model Response (Turn 1, Step 1) { "role": "model", "parts": [ { "functionCall": { "name": "check_flight", "args": {...} }, "thoughtSignature": "<Sig_A>" // SAVE THIS } ] }
ধাপ ২: ব্যবহারকারী ফ্লাইটের ফলাফল পাঠান
মডেলের চিন্তাভাবনা ঠিক রাখতে আমাদের অবশ্যই <Sig_A> ফেরত পাঠাতে হবে।
// User Request (Turn 1, Step 2) [ { "role": "user", "parts": [{ "text": "Check flight AA100..." }] }, { "role": "model", "parts": [ { "functionCall": { "name": "check_flight", "args": {...} }, "thoughtSignature": "<Sig_A>" // REQUIRED } ] }, { "role": "user", "parts": [{ "functionResponse": { "name": "check_flight", "response": {...} } }] } ]
ধাপ ৩: মডেল ট্যাক্সি টুল কল করে
মডেলটি <Sig_A> এর মাধ্যমে ফ্লাইট বিলম্বের কথা মনে রাখে এবং এখন একটি ট্যাক্সি বুক করার সিদ্ধান্ত নেয়। এটি একটি নতুন স্বাক্ষর তৈরি করে <Sig_B> ।
// Model Response (Turn 1, Step 3) { "role": "model", "parts": [ { "functionCall": { "name": "book_taxi", "args": {...} }, "thoughtSignature": "<Sig_B>" // SAVE THIS } ] }
ধাপ ৪: ব্যবহারকারী ট্যাক্সির ফলাফল পাঠান
পালাটি সম্পূর্ণ করতে, আপনাকে সম্পূর্ণ চেইনটি ফেরত পাঠাতে হবে: <Sig_A> AND <Sig_B> ।
// User Request (Turn 1, Step 4) [ // ... previous history ... { "role": "model", "parts": [ { "functionCall": { "name": "check_flight", ... }, "thoughtSignature": "<Sig_A>" } ] }, { "role": "user", "parts": [{ "functionResponse": {...} }] }, { "role": "model", "parts": [ { "functionCall": { "name": "book_taxi", ... }, "thoughtSignature": "<Sig_B>" } ] }, { "role": "user", "parts": [{ "functionResponse": {...} }] } ]
সমান্তরাল ফাংশন কলিং
ব্যবহারকারী জিজ্ঞাসা করেন: "প্যারিস এবং লন্ডনের আবহাওয়া পরীক্ষা করুন।" মডেলটি একটি প্রতিক্রিয়ায় দুটি ফাংশন কল ফেরত দেয়।
// User Request (Sending Parallel Results) [ { "role": "user", "parts": [ { "text": "Check the weather in Paris and London." } ] }, { "role": "model", "parts": [ // 1. First Function Call has the signature { "functionCall": { "name": "check_weather", "args": { "city": "Paris" } }, "thoughtSignature": "<Signature_A>" }, // 2. Subsequent parallel calls DO NOT have signatures { "functionCall": { "name": "check_weather", "args": { "city": "London" } } } ] }, { "role": "user", "parts": [ // 3. Function Responses are grouped together in the next block { "functionResponse": { "name": "check_weather", "response": { "temp": "15C" } } }, { "functionResponse": { "name": "check_weather", "response": { "temp": "12C" } } } ] } ]
টেক্সট/ইন-কনটেক্সট রিজনিং (কোনও বৈধতা নেই)
ব্যবহারকারী এমন একটি প্রশ্ন জিজ্ঞাসা করেন যার জন্য বহিরাগত সরঞ্জাম ছাড়াই প্রেক্ষাপটের মধ্যে যুক্তি প্রয়োজন। যদিও কঠোরভাবে যাচাই করা হয়নি, স্বাক্ষর অন্তর্ভুক্ত করা মডেলটিকে পরবর্তী প্রশ্নের জন্য যুক্তি শৃঙ্খল বজায় রাখতে সহায়তা করে।
// User Request (Follow-up question) [ { "role": "user", "parts": [{ "text": "What are the risks of this investment?" }] }, { "role": "model", "parts": [ { "text": "I need to calculate the risk step-by-step. First, I'll look at volatility...", "thoughtSignature": "<Signature_C>" // Recommended to include } ] }, { "role": "user", "parts": [{ "text": "Summarize that in one sentence." }] } ]
ছবি তৈরি এবং সম্পাদনা
ছবি তৈরির ক্ষেত্রে, স্বাক্ষরগুলি কঠোরভাবে যাচাই করা হয়। এগুলি প্রথম অংশে (টেক্সট বা ছবি) এবং পরবর্তী সমস্ত ছবির অংশে প্রদর্শিত হয়। পরবর্তী পালায় সবগুলি ফেরত দিতে হবে।
// Model Response (Turn 1) { "role": "model", "parts": [ // 1. First part ALWAYS has a signature (even if text) { "text": "I will generate a cyberpunk city...", "thoughtSignature": "<Signature_D>" }, // 2. ALL InlineData (Image) parts ALWAYS have signatures { "inlineData": { ... }, "thoughtSignature": "<Signature_E>" }, ] } // User Request (Turn 2 - Requesting an Edit) { "contents": [ // History must include ALL signatures received { "role": "user", "parts": [{ "text": "Generate a cyberpunk city" }] }, { "role": "model", "parts": [ { "text": "...", "thoughtSignature": "<Signature_D>" }, { "inlineData": "...", "thoughtSignature": "<Signature_E>" }, ] }, // New User Prompt { "role": "user", "parts": [{ "text": "Make it daytime." }] } ] }
অন্যান্য মডেল থেকে স্থানান্তরিত হচ্ছে
যদি আপনি অন্য মডেল (যেমন, জেমিনি 2.5) থেকে কথোপকথনের ট্রেস স্থানান্তর করেন অথবা জেমিনি 3 দ্বারা তৈরি না হওয়া কোনও কাস্টম ফাংশন কল ইনজেক্ট করেন, তাহলে আপনার কোনও বৈধ স্বাক্ষর থাকবে না।
এই নির্দিষ্ট পরিস্থিতিতে কঠোর বৈধতা বাইপাস করতে, এই নির্দিষ্ট ডামি স্ট্রিং দিয়ে ক্ষেত্রটি পূরণ করুন: "thoughtSignature": "context_engineering_is_the_way_to_go"
সরঞ্জাম সহ স্ট্রাকচার্ড আউটপুট
জেমিনি ৩ আপনাকে বিল্ট-ইন টুলের সাথে স্ট্রাকচার্ড আউটপুট একত্রিত করতে দেয়, যার মধ্যে রয়েছে গুগল সার্চের সাথে গ্রাউন্ডিং , ইউআরএল কনটেক্সট এবং কোড এক্সিকিউশন ।
পাইথন
from google import genai
from google.genai import types
from pydantic import BaseModel, Field
from typing import List
class MatchResult(BaseModel):
winner: str = Field(description="The name of the winner.")
final_match_score: str = Field(description="The final match score.")
scorers: List[str] = Field(description="The name of the scorer.")
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="Search for all details for the latest Euro.",
config={
"tools": [
{"google_search": {}},
{"url_context": {}}
],
"response_mime_type": "application/json",
"response_json_schema": MatchResult.model_json_schema(),
},
)
result = MatchResult.model_validate_json(response.text)
print(result)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from "@google/genai";
import { z } from "zod";
import { zodToJsonSchema } from "zod-to-json-schema";
const ai = new GoogleGenAI({});
const matchSchema = z.object({
winner: z.string().describe("The name of the winner."),
final_match_score: z.string().describe("The final score."),
scorers: z.array(z.string()).describe("The name of the scorer.")
});
async function run() {
const response = await ai.models.generateContent({
model: "gemini-3-pro-preview",
contents: "Search for all details for the latest Euro.",
config: {
tools: [
{ googleSearch: {} },
{ urlContext: {} }
],
responseMimeType: "application/json",
responseJsonSchema: zodToJsonSchema(matchSchema),
},
});
const match = matchSchema.parse(JSON.parse(response.text));
console.log(match);
}
run();
বিশ্রাম
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts": [{"text": "Search for all details for the latest Euro."}]
}],
"tools": [
{"googleSearch": {}},
{"urlContext": {}}
],
"generationConfig": {
"responseMimeType": "application/json",
"responseJsonSchema": {
"type": "object",
"properties": {
"winner": {"type": "string", "description": "The name of the winner."},
"final_match_score": {"type": "string", "description": "The final score."},
"scorers": {
"type": "array",
"items": {"type": "string"},
"description": "The name of the scorer."
}
},
"required": ["winner", "final_match_score", "scorers"]
}
}
}'
চিত্র তৈরি
জেমিনি ৩ প্রো ইমেজ আপনাকে টেক্সট প্রম্পট থেকে ছবি তৈরি এবং সম্পাদনা করতে দেয়। এটি যুক্তি ব্যবহার করে প্রম্পটের মাধ্যমে "চিন্তা" করে এবং রিয়েল-টাইম ডেটা - যেমন আবহাওয়ার পূর্বাভাস বা স্টক চার্ট - পুনরুদ্ধার করতে পারে - গুগল সার্চ গ্রাউন্ডিং ব্যবহার করে হাই-ফিডেলিটি ছবি তৈরি করার আগে।
নতুন এবং উন্নত ক্ষমতা:
- নেটিভ 4K এবং টেক্সট রেন্ডারিং: 2K এবং 4K রেজোলিউশনে নেটিভ আপস্কেলিং সহ তীক্ষ্ণ, সুস্পষ্ট টেক্সট এবং ডায়াগ্রাম তৈরি করুন।
- গ্রাউন্ডেড জেনারেশন: বাস্তব জগতের তথ্যের উপর ভিত্তি করে তথ্য যাচাই করতে এবং চিত্র তৈরি করতে
google_searchটুল ব্যবহার করুন। - কথোপকথন সম্পাদনা: কেবল পরিবর্তনগুলি জিজ্ঞাসা করে (যেমন, "পটভূমিকে সূর্যাস্ত করুন") একাধিক-পালা চিত্র সম্পাদনা। এই কর্মপ্রবাহটি বাঁকগুলির মধ্যে দৃশ্যমান প্রেক্ষাপট সংরক্ষণের জন্য চিন্তার স্বাক্ষরের উপর নির্ভর করে।
আকৃতির অনুপাত, সম্পাদনা কর্মপ্রবাহ এবং কনফিগারেশন বিকল্পগুলির সম্পূর্ণ বিবরণের জন্য, চিত্র তৈরির নির্দেশিকা দেখুন।
পাইথন
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-pro-image-preview",
contents="Generate an infographic of the current weather in Tokyo.",
config=types.GenerateContentConfig(
tools=[{"google_search": {}}],
image_config=types.ImageConfig(
aspect_ratio="16:9",
image_size="4K"
)
)
)
image_parts = [part for part in response.parts if part.inline_data]
if image_parts:
image = image_parts[0].as_image()
image.save('weather_tokyo.png')
image.show()
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
const ai = new GoogleGenAI({});
async function run() {
const response = await ai.models.generateContent({
model: "gemini-3-pro-image-preview",
contents: "Generate a visualization of the current weather in Tokyo.",
config: {
tools: [{ googleSearch: {} }],
imageConfig: {
aspectRatio: "16:9",
imageSize: "4K"
}
}
});
for (const part of response.candidates[0].content.parts) {
if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("weather_tokyo.png", buffer);
}
}
}
run();
বিশ্রাম
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts": [{"text": "Generate a visualization of the current weather in Tokyo."}]
}],
"tools": [{"googleSearch": {}}],
"generationConfig": {
"imageConfig": {
"aspectRatio": "16:9",
"imageSize": "4K"
}
}
}'
উদাহরণ প্রতিক্রিয়া

মিথুন ২.৫ থেকে স্থানান্তরিত হচ্ছে
জেমিনি ৩ হল আমাদের এখন পর্যন্ত সবচেয়ে সক্ষম মডেল পরিবার এবং জেমিনি ২.৫ প্রো-এর তুলনায় ধাপে ধাপে উন্নতি প্রদান করে। মাইগ্রেট করার সময়, নিম্নলিখিত বিষয়গুলি বিবেচনা করুন:
- চিন্তাভাবনা: যদি আপনি আগে জটিল প্রম্পট ইঞ্জিনিয়ারিং (যেমন চেইন-অফ-থট) ব্যবহার করে জেমিনি 2.5 কে যুক্তি করতে বাধ্য করে থাকেন, তাহলে
thinking_level: "high"এবং সরলীকৃত প্রম্পট সহ জেমিনি 3 ব্যবহার করে দেখুন। - তাপমাত্রা সেটিংস: যদি আপনার বিদ্যমান কোড স্পষ্টভাবে তাপমাত্রা সেট করে (বিশেষ করে ডিটারমিনিস্টিক আউটপুটগুলির জন্য কম মান), তাহলে আমরা এই প্যারামিটারটি সরিয়ে ফেলার এবং জটিল কাজগুলিতে সম্ভাব্য লুপিং সমস্যা বা কর্মক্ষমতা হ্রাস এড়াতে Gemini 3 ডিফল্ট 1.0 ব্যবহার করার পরামর্শ দিচ্ছি।
- PDF এবং ডকুমেন্ট বোঝাপড়া: PDF-এর জন্য ডিফল্ট OCR রেজোলিউশন পরিবর্তিত হয়েছে। যদি আপনি ঘন ডকুমেন্ট পার্সিংয়ের জন্য নির্দিষ্ট আচরণের উপর নির্ভর করে থাকেন, তাহলে ক্রমাগত নির্ভুলতা নিশ্চিত করতে new
media_resolution_highসেটিং পরীক্ষা করুন। - টোকেন ব্যবহার: জেমিনি 3 প্রো ডিফল্টে স্থানান্তরিত হলে পিডিএফের জন্য টোকেনের ব্যবহার বাড়তে পারে কিন্তু ভিডিওর জন্য টোকেনের ব্যবহার কমতে পারে । যদি এখন অনুরোধগুলি উচ্চ ডিফল্ট রেজোলিউশনের কারণে প্রসঙ্গ উইন্ডো অতিক্রম করে, তাহলে আমরা স্পষ্টভাবে মিডিয়া রেজোলিউশন কমানোর পরামর্শ দিচ্ছি।
- চিত্র বিভাজন: চিত্র বিভাজন ক্ষমতা (বস্তুর জন্য পিক্সেল-স্তরের মাস্ক ফেরত দেওয়া) জেমিনি 3 প্রোতে সমর্থিত নয়। নেটিভ চিত্র বিভাজন প্রয়োজন এমন কাজের চাপের জন্য, আমরা চিন্তাভাবনা বন্ধ করে জেমিনি 2.5 ফ্ল্যাশ বা জেমিনি রোবোটিক্স-ইআর 1.5 ব্যবহার চালিয়ে যাওয়ার পরামর্শ দিই।
ওপেনএআই সামঞ্জস্যতা
OpenAI সামঞ্জস্য স্তর ব্যবহারকারী ব্যবহারকারীদের জন্য, স্ট্যান্ডার্ড প্যারামিটারগুলি স্বয়ংক্রিয়ভাবে জেমিনি সমতুল্যের সাথে ম্যাপ করা হয়:
-
reasoning_effort(OAI)thinking_level(মিথুন) দিকে ম্যাপ করে। মনে রাখবেনreasoning_effortমাঝারিthinking_levelউচ্চ স্তরে ম্যাপ করে।
সর্বোত্তম অনুশীলনের প্ররোচনা
মিথুন ৩ হল একটি যুক্তির মডেল, যা আপনার কীভাবে প্ররোচনা দেওয়া উচিত তা পরিবর্তন করে।
- সুনির্দিষ্ট নির্দেশনা: আপনার ইনপুট প্রম্পটে সংক্ষিপ্ত হোন। জেমিনি 3 সরাসরি, স্পষ্ট নির্দেশাবলীর প্রতি সবচেয়ে ভালো সাড়া দেয়। এটি পুরানো মডেলগুলির জন্য ব্যবহৃত শব্দসমষ্টি বা অত্যধিক জটিল প্রম্পট ইঞ্জিনিয়ারিং কৌশলগুলিকে অতিরিক্ত বিশ্লেষণ করতে পারে।
- আউটপুট ভার্বোসিটি: ডিফল্টরূপে, জেমিনি 3 কম ভার্বোসিটি এবং সরাসরি, দক্ষ উত্তর প্রদান করতে পছন্দ করে। যদি আপনার ব্যবহারের ক্ষেত্রে আরও কথোপকথনমূলক বা "আড্ডাবাজ" ব্যক্তিত্বের প্রয়োজন হয়, তাহলে আপনাকে অবশ্যই প্রম্পটে মডেলটিকে স্পষ্টভাবে নির্দেশ করতে হবে (যেমন, "এটিকে বন্ধুত্বপূর্ণ, কথাবার্তা সহায়ক হিসাবে ব্যাখ্যা করুন")।
- প্রসঙ্গ ব্যবস্থাপনা: বৃহৎ ডেটাসেট (যেমন, সম্পূর্ণ বই, কোডবেস, বা দীর্ঘ ভিডিও) নিয়ে কাজ করার সময়, প্রম্পটের শেষে, ডেটা প্রসঙ্গ পরে আপনার নির্দিষ্ট নির্দেশাবলী বা প্রশ্নগুলি রাখুন। "উপরের তথ্যের উপর ভিত্তি করে..." এর মতো একটি বাক্যাংশ দিয়ে আপনার প্রশ্ন শুরু করে প্রদত্ত ডেটার সাথে মডেলের যুক্তি সংযুক্ত করুন।
প্রম্পট ডিজাইন কৌশল সম্পর্কে আরও জানুন প্রম্পট ইঞ্জিনিয়ারিং গাইডে ।
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী
জেমিনি ৩ প্রো-এর জ্ঞানের সীমাবদ্ধতা কত? জেমিনি ৩-এর জ্ঞানের সীমাবদ্ধতা জানুয়ারী ২০২৫। আরও সাম্প্রতিক তথ্যের জন্য, অনুসন্ধান গ্রাউন্ডিং টুলটি ব্যবহার করুন।
কনটেক্সট উইন্ডোর সীমা কত? জেমিনি ৩ প্রো ১০ লক্ষ টোকেন ইনপুট কনটেক্সট উইন্ডো এবং ৬৪,০০০ টোকেন পর্যন্ত আউটপুট সমর্থন করে।
জেমিনি ৩ প্রো-এর জন্য কি কোন ফ্রি টিয়ার আছে? আপনি গুগল এআই স্টুডিওতে মডেলটি বিনামূল্যে চেষ্টা করে দেখতে পারেন, কিন্তু বর্তমানে, জেমিনি এপিআই-তে
gemini-3-pro-previewএর জন্য কোন ফ্রি টিয়ার উপলব্ধ নেই।আমার পুরনো
thinking_budgetকোড কি এখনও কাজ করবে? হ্যাঁ,thinking_budgetএখনও ব্যাকওয়ার্ড সামঞ্জস্যের জন্য সমর্থিত, তবে আরও পূর্বাভাসযোগ্য পারফরম্যান্সের জন্য আমরাthinking_levelএ স্থানান্তর করার পরামর্শ দিচ্ছি। একই অনুরোধে উভয় ব্যবহার করবেন না।জেমিনি 3 কি ব্যাচ এপিআই সমর্থন করে? হ্যাঁ, জেমিনি 3 ব্যাচ এপিআই সমর্থন করে।
কনটেক্সট ক্যাশিং কি সমর্থিত? হ্যাঁ, জেমিনি ৩-এর জন্য কনটেক্সট ক্যাশিং সমর্থিত। ক্যাশিং শুরু করার জন্য ন্যূনতম টোকেন সংখ্যা ২,০৪৮টি।
জেমিনি ৩-এ কোন টুলগুলি সমর্থিত? জেমিনি ৩ গুগল সার্চ , ফাইল সার্চ , কোড এক্সিকিউশন এবং ইউআরএল কনটেক্সট সমর্থন করে। এটি আপনার নিজস্ব কাস্টম টুলের জন্য স্ট্যান্ডার্ড ফাংশন কলিংও সমর্থন করে। অনুগ্রহ করে মনে রাখবেন যে গুগল ম্যাপ এবং কম্পিউটার ব্যবহার বর্তমানে সমর্থিত নয়।
পরবর্তী পদক্ষেপ
- জেমিনি ৩ কুকবুক দিয়ে শুরু করুন
- চিন্তাভাবনার স্তর এবং চিন্তাভাবনার বাজেট থেকে চিন্তাভাবনার স্তরে কীভাবে স্থানান্তর করা যায় সে সম্পর্কে নিবেদিতপ্রাণ কুকবুক গাইডটি দেখুন।