জেমিনি ৩.১ প্রো প্রিভিউ ঘোষণা করা হচ্ছে। গুগল এআই স্টুডিওতে এটি বিনামূল্যে ব্যবহার করে দেখুন ।

এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

জেমিনি ৩ ডেভেলপার গাইড

জেমিনি ৩ হল আমাদের এখন পর্যন্ত সবচেয়ে বুদ্ধিমান মডেল পরিবার, যা অত্যাধুনিক যুক্তির ভিত্তির উপর নির্মিত। এটি এজেন্টিক ওয়ার্কফ্লো, স্বায়ত্তশাসিত কোডিং এবং জটিল মাল্টিমোডাল কাজগুলিতে দক্ষতা অর্জনের মাধ্যমে যেকোনো ধারণাকে বাস্তবে রূপ দেওয়ার জন্য ডিজাইন করা হয়েছে। এই নির্দেশিকাটিতে জেমিনি ৩ মডেল পরিবারের মূল বৈশিষ্ট্যগুলি এবং এর থেকে সর্বাধিক সুবিধা কীভাবে পাওয়া যায় তা আলোচনা করা হয়েছে।

জেমিনি ৩.১ প্রো প্রিভিউ ব্যবহার করে দেখুন জেমিনি ৩ ফ্ল্যাশ ব্যবহার করে দেখুন ন্যানো ব্যানানা প্রো ব্যবহার করে দেখুন

আমাদের জেমিনি ৩ অ্যাপের সংগ্রহ ঘুরে দেখুন এবং দেখুন কিভাবে মডেলটি উন্নত যুক্তি, স্বায়ত্তশাসিত কোডিং এবং জটিল মাল্টিমোডাল কাজগুলি পরিচালনা করে।

কয়েকটি লাইন কোড দিয়ে শুরু করুন:

পাইথন

from google import genai

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="Find the race condition in this multi-threaded C++ snippet: [code here]",
)

print(response.text)

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function run() {
  const response = await ai.models.generateContent({
    model: "gemini-3.1-pro-preview",
    contents: "Find the race condition in this multi-threaded C++ snippet: [code here]",
  });

  console.log(response.text);
}

run();

বিশ্রাম

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Find the race condition in this multi-threaded C++ snippet: [code here]"}]
    }]
  }'

জেমিনি ৩ সিরিজের সাথে পরিচিত হোন

নতুন সিরিজের প্রথম মডেল, জেমিনি ৩ প্রো, জটিল কাজের জন্য সবচেয়ে ভালো, যার জন্য বিস্তৃত বিশ্ব জ্ঞান এবং বিভিন্ন পদ্ধতিতে উন্নত যুক্তির প্রয়োজন হয়। জেমিনি ৩.১ প্রো হল ৩ প্রো পরিবারের কর্মক্ষমতা, আচরণ এবং বুদ্ধিমত্তার উন্নতির পরবর্তী সংস্করণ।

জেমিনি ৩ ফ্ল্যাশ হল আমাদের সর্বশেষ ৩-সিরিজ মডেল, যার গতি এবং মূল্যের দিক থেকে প্রো-লেভেল বুদ্ধিমত্তা ফ্ল্যাশের মতোই।

ন্যানো ব্যানানা প্রো (যা জেমিনি ৩ প্রো ইমেজ নামেও পরিচিত) আমাদের এখনও পর্যন্ত সর্বোচ্চ মানের ইমেজ জেনারেশন মডেল।

সমস্ত জেমিনি ৩ মডেল বর্তমানে প্রিভিউতে রয়েছে।

মডেল আইডি	প্রসঙ্গ উইন্ডো (ইন / আউট)	জ্ঞান সীমা	মূল্য নির্ধারণ (ইনপুট / আউটপুট)*
জেমিনি-৩.১-প্রো-প্রিভিউ	১ মে / ৬৪ হাজার	জানুয়ারী ২০২৫	$২ / $১২ (<২০০,০০০ টোকেন) $৪ / $১৮ (>২০০,০০০ টোকেন)
জেমিনি-৩-প্রো-প্রিভিউ	১ মে / ৬৪ হাজার	জানুয়ারী ২০২৫	$২ / $১২ (<২০০,০০০ টোকেন) $৪ / $১৮ (>২০০,০০০ টোকেন)
জেমিনি-৩-ফ্ল্যাশ-প্রিভিউ	১ মে / ৬৪ হাজার	জানুয়ারী ২০২৫	$০.৫০ / $৩
জেমিনি-৩-প্রো-ইমেজ-প্রিভিউ	৬৫ হাজার / ৩২ হাজার	জানুয়ারী ২০২৫	$২ (টেক্সট ইনপুট) / $০.১৩৪ (ছবি আউটপুট)**

* অন্যথায় উল্লেখ না করা থাকলে প্রতি ১০ লক্ষ টোকেনের জন্য মূল্য নির্ধারণ করা হয়েছে। ** ছবির মূল্য রেজোলিউশন অনুসারে পরিবর্তিত হয়। বিস্তারিত জানার জন্য মূল্য পৃষ্ঠাটি দেখুন।

বিস্তারিত সীমা, মূল্য নির্ধারণ এবং অতিরিক্ত তথ্যের জন্য, মডেল পৃষ্ঠাটি দেখুন।

জেমিনি ৩-এ নতুন API বৈশিষ্ট্য

জেমিনি ৩ নতুন প্যারামিটার প্রবর্তন করেছে যা ডেভেলপারদের লেটেন্সি, খরচ এবং মাল্টিমোডাল বিশ্বস্ততার উপর আরও নিয়ন্ত্রণ দেওয়ার জন্য ডিজাইন করা হয়েছে।

চিন্তাভাবনার স্তর

জেমিনি ৩ সিরিজের মডেলগুলি প্রম্পটের মাধ্যমে যুক্তি করার জন্য ডিফল্টভাবে গতিশীল চিন্তাভাবনা ব্যবহার করে। আপনি thinking_level প্যারামিটার ব্যবহার করতে পারেন, যা প্রতিক্রিয়া তৈরি করার আগে মডেলের অভ্যন্তরীণ যুক্তি প্রক্রিয়ার সর্বাধিক গভীরতা নিয়ন্ত্রণ করে। জেমিনি ৩ এই স্তরগুলিকে কঠোর টোকেন গ্যারান্টির পরিবর্তে চিন্তাভাবনার জন্য আপেক্ষিক ভাতা হিসাবে বিবেচনা করে।

যদি thinking_level নির্দিষ্ট না করা থাকে, তাহলে Gemini 3 ডিফল্টভাবে high এ থাকবে। জটিল যুক্তির প্রয়োজন না হলে দ্রুত, কম-বিলম্বিত প্রতিক্রিয়ার জন্য, আপনি মডেলের চিন্তাভাবনার স্তরকে low এ সীমাবদ্ধ করতে পারেন।

চিন্তাভাবনার স্তর	জেমিনি ৩.১ প্রো	জেমিনি ৩ প্রো	জেমিনি 3 ফ্ল্যাশ	বিবরণ
`minimal`	সমর্থিত নয়	সমর্থিত নয়	সমর্থিত	বেশিরভাগ প্রশ্নের জন্য "কোনও চিন্তাভাবনা নেই" সেটিংটি মেলে। জটিল কোডিং কাজের জন্য মডেলটি খুব কম চিন্তা করতে পারে। চ্যাট বা উচ্চ থ্রুপুট অ্যাপ্লিকেশনের জন্য লেটেন্সি কমিয়ে দেয়। মনে রাখবেন, `minimal` গ্যারান্টি দেয় না যে চিন্তাভাবনা বন্ধ আছে।
`low`	সমর্থিত	সমর্থিত	সমর্থিত	বিলম্ব এবং খরচ কমিয়ে দেয়। সহজ নির্দেশনা অনুসরণ, চ্যাট, অথবা উচ্চ-থ্রুপুট অ্যাপ্লিকেশনের জন্য সেরা।
`medium`	সমর্থিত	সমর্থিত নয়	সমর্থিত	বেশিরভাগ কাজের জন্য ভারসাম্যপূর্ণ চিন্তাভাবনা।
`high`	সমর্থিত (ডিফল্ট, গতিশীল)	সমর্থিত (ডিফল্ট, গতিশীল)	সমর্থিত (ডিফল্ট, গতিশীল)	যুক্তির গভীরতা সর্বাধিক করে তোলে। মডেলটি প্রথম (চিন্তাহীন) আউটপুট টোকেনে পৌঁছাতে উল্লেখযোগ্যভাবে বেশি সময় নিতে পারে, তবে আউটপুটটি আরও সাবধানতার সাথে যুক্তিযুক্ত হবে।

পাইথন

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="How does AI work?",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="low")
    ),
)

print(response.text)

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const response = await ai.models.generateContent({
    model: "gemini-3.1-pro-preview",
    contents: "How does AI work?",
    config: {
      thinkingConfig: {
        thinkingLevel: "low",
      }
    },
  });

console.log(response.text);

বিশ্রাম

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "How does AI work?"}]
    }],
    "generationConfig": {
      "thinkingConfig": {
        "thinkingLevel": "low"
      }
    }
  }'

মিডিয়া রেজোলিউশন

জেমিনি 3 media_resolution প্যারামিটারের মাধ্যমে মাল্টিমোডাল ভিশন প্রসেসিংয়ের উপর গ্রানুলার নিয়ন্ত্রণ প্রবর্তন করে। উচ্চ রেজোলিউশন মডেলের সূক্ষ্ম টেক্সট পড়ার বা ছোট বিবরণ সনাক্ত করার ক্ষমতা উন্নত করে, তবে টোকেনের ব্যবহার এবং ল্যাটেন্সি বৃদ্ধি করে। media_resolution প্যারামিটার প্রতি ইনপুট চিত্র বা ভিডিও ফ্রেমে বরাদ্দকৃত টোকেনের সর্বাধিক সংখ্যা নির্ধারণ করে।

আপনি এখন রেজোলিউশনটি প্রতিটি মিডিয়া অংশের জন্য অথবা বিশ্বব্যাপী ( generation_config মাধ্যমে, আল্ট্রা হাই এর জন্য global উপলব্ধ নয়) media_resolution_low , media_resolution_medium , media_resolution_high , অথবা media_resolution_ultra_high এ সেট করতে পারেন। যদি নির্দিষ্ট না করা থাকে, তাহলে মডেলটি মিডিয়া ধরণের উপর ভিত্তি করে সর্বোত্তম ডিফল্ট ব্যবহার করে।

প্রস্তাবিত সেটিংস

মিডিয়া টাইপ	প্রস্তাবিত সেটিং	সর্বোচ্চ টোকেন	ব্যবহারের নির্দেশিকা
ছবি	`media_resolution_high`	১১২০	সর্বাধিক গুণমান নিশ্চিত করার জন্য বেশিরভাগ চিত্র বিশ্লেষণ কাজের জন্য প্রস্তাবিত।
পিডিএফ	`media_resolution_medium`	৫৬০	নথি বোঝার জন্য সর্বোত্তম; মান সাধারণত `medium` তাপমাত্রায় পরিপূর্ণ হয়। `high` স্তরে বৃদ্ধি করলে স্ট্যান্ডার্ড নথির জন্য OCR ফলাফল খুব কমই উন্নত হয়।
ভিডিও (সাধারণ)	`media_resolution_low` (অথবা `media_resolution_medium` )	৭০ (প্রতি ফ্রেমে)	দ্রষ্টব্য: ভিডিওর ক্ষেত্রে, প্রসঙ্গ ব্যবহার অপ্টিমাইজ করার জন্য `low` এবং `medium` সেটিংস একইভাবে (৭০টি টোকেন) ব্যবহার করা হয়। বেশিরভাগ অ্যাকশন শনাক্তকরণ এবং বর্ণনামূলক কাজের জন্য এটি যথেষ্ট।
ভিডিও (লেখার পরিধি বেশি)	`media_resolution_high`	২৮০ (প্রতি ফ্রেমে)	শুধুমাত্র তখনই প্রয়োজন যখন ব্যবহারের ক্ষেত্রে ঘন টেক্সট (OCR) বা ভিডিও ফ্রেমের মধ্যে ছোট ছোট বিবরণ পড়া জড়িত থাকে।

দ্রষ্টব্য: ইনপুট ধরণের উপর নির্ভর করে media_resolution প্যারামিটার বিভিন্ন টোকেন গণনার সাথে মানানসই। ছবিগুলি রৈখিকভাবে স্কেল করলে ( media_resolution_low : ২৮০, media_resolution_medium : ৫৬০, media_resolution_high : ১১২০), ভিডিওটি আরও আক্রমণাত্মকভাবে সংকুচিত হয়। ভিডিওর জন্য, media_resolution_low এবং media_resolution_medium উভয়ই প্রতি ফ্রেমে ৭০ টোকেন এবং media_resolution_high ২৮০ টোকেন সীমাবদ্ধ। মিডিয়া রেজোলিউশন পৃষ্ঠায় সম্পূর্ণ বিবরণ দেখুন।

পাইথন

from google import genai
from google.genai import types
import base64

# The media_resolution parameter is currently only available in the v1alpha API version.
client = genai.Client(http_options={'api_version': 'v1alpha'})

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents=[
        types.Content(
            parts=[
                types.Part(text="What is in this image?"),
                types.Part(
                    inline_data=types.Blob(
                        mime_type="image/jpeg",
                        data=base64.b64decode("..."),
                    ),
                    media_resolution={"level": "media_resolution_high"}
                )
            ]
        )
    ]
)

print(response.text)

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";

// The media_resolution parameter is currently only available in the v1alpha API version.
const ai = new GoogleGenAI({ apiVersion: "v1alpha" });

async function run() {
  const response = await ai.models.generateContent({
    model: "gemini-3.1-pro-preview",
    contents: [
      {
        parts: [
          { text: "What is in this image?" },
          {
            inlineData: {
              mimeType: "image/jpeg",
              data: "...",
            },
            mediaResolution: {
              level: "media_resolution_high"
            }
          }
        ]
      }
    ]
  });

  console.log(response.text);
}

run();

বিশ্রাম

curl "https://generativelanguage.googleapis.com/v1alpha/models/gemini-3.1-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [
        { "text": "What is in this image?" },
        {
          "inlineData": {
            "mimeType": "image/jpeg",
            "data": "..."
          },
          "mediaResolution": {
            "level": "media_resolution_high"
          }
        }
      ]
    }]
  }'

তাপমাত্রা

সমস্ত জেমিনি 3 মডেলের জন্য, আমরা দৃঢ়ভাবে তাপমাত্রার প্যারামিটারটিকে তার ডিফল্ট মান 1.0 এ রাখার পরামর্শ দিচ্ছি।

পূর্ববর্তী মডেলগুলি প্রায়শই সৃজনশীলতা বনাম নির্ধারণবাদ নিয়ন্ত্রণের জন্য তাপমাত্রা টিউন করার সুবিধা পেয়েছিল, তবে জেমিনি 3 এর যুক্তি ক্ষমতাগুলি ডিফল্ট সেটিংসের জন্য অপ্টিমাইজ করা হয়েছে। তাপমাত্রা পরিবর্তন (এটি 1.0 এর নিচে সেট করা) অপ্রত্যাশিত আচরণের দিকে পরিচালিত করতে পারে, যেমন লুপিং বা কর্মক্ষমতা হ্রাস, বিশেষ করে জটিল গাণিতিক বা যুক্তির কাজে।

চিন্তার স্বাক্ষর

জেমিনি 3 API কলগুলিতে যুক্তির প্রেক্ষাপট বজায় রাখার জন্য চিন্তার স্বাক্ষর ব্যবহার করে। এই স্বাক্ষরগুলি মডেলের অভ্যন্তরীণ চিন্তা প্রক্রিয়ার এনক্রিপ্ট করা উপস্থাপনা। মডেলটি তার যুক্তির ক্ষমতা বজায় রাখে তা নিশ্চিত করার জন্য আপনাকে অবশ্যই এই স্বাক্ষরগুলি আপনার অনুরোধে মডেলে ঠিক যেভাবে গৃহীত হয়েছিল ঠিক সেইভাবে ফেরত পাঠাতে হবে:

ফাংশন কলিং (কঠোর): API "কারেন্ট টার্ন"-এ কঠোর বৈধতা প্রয়োগ করে। স্বাক্ষর হারিয়ে গেলে 400 ত্রুটি দেখা দেবে।
দ্রষ্টব্য: জেমিনি 3 ফ্ল্যাশের জন্য চিন্তাভাবনার স্তর minimal সেট করা থাকলেও চিন্তার স্বাক্ষরের সঞ্চালন প্রয়োজন।
টেক্সট/চ্যাট: বৈধতা কঠোরভাবে প্রয়োগ করা হয় না, তবে স্বাক্ষর বাদ দিলে মডেলের যুক্তি এবং উত্তরের মান খারাপ হবে।
ছবি তৈরি/সম্পাদনা (কঠোর) : API thoughtSignature সহ সকল মডেল অংশে কঠোর বৈধতা প্রয়োগ করে। স্বাক্ষর অনুপস্থিত থাকলে 400 ত্রুটি দেখা দেবে।

ফাংশন কলিং (কঠোর বৈধতা)

যখন জেমিনি একটি functionCall তৈরি করে, তখন পরবর্তী টার্নে টুলের আউটপুট সঠিকভাবে প্রক্রিয়া করার জন্য এটি thoughtSignature এর উপর নির্ভর করে। "Current Turn"-এ শেষ স্ট্যান্ডার্ড User text মেসেজ থেকে সংঘটিত সমস্ত Model ( functionCall ) এবং User ( functionResponse ) ধাপ অন্তর্ভুক্ত থাকে।

একক ফাংশন কল: functionCall অংশে একটি স্বাক্ষর রয়েছে। আপনাকে এটি ফেরত দিতে হবে।
সমান্তরাল ফাংশন কল: তালিকার শুধুমাত্র প্রথম functionCall অংশে স্বাক্ষর থাকবে। আপনাকে অবশ্যই প্রাপ্ত ক্রমে অংশগুলি ফেরত দিতে হবে।
মাল্টি-স্টেপ (সিকুয়েনশিয়াল): যদি মডেলটি একটি টুল কল করে, ফলাফল পায় এবং অন্য একটি টুল কল করে (একই পালাক্রমে), তাহলে উভয় ফাংশন কলেই স্বাক্ষর থাকবে। আপনাকে ইতিহাসে জমা হওয়া সমস্ত স্বাক্ষর ফেরত দিতে হবে।

টেক্সট এবং স্ট্রিমিং

স্ট্যান্ডার্ড চ্যাট বা টেক্সট জেনারেশনের জন্য, স্বাক্ষরের উপস্থিতি নিশ্চিত নয়।

নন-স্ট্রিমিং : প্রতিক্রিয়ার চূড়ান্ত বিষয়বস্তু অংশে একটি thoughtSignature থাকতে পারে, যদিও এটি সর্বদা উপস্থিত থাকে না। যদি একটি ফেরত দেওয়া হয়, তাহলে সর্বোত্তম কর্মক্ষমতা বজায় রাখার জন্য আপনার এটি ফেরত পাঠানো উচিত।
স্ট্রিমিং : যদি একটি স্বাক্ষর তৈরি করা হয়, তাহলে এটি একটি চূড়ান্ত অংশে আসতে পারে যার মধ্যে একটি খালি টেক্সট অংশ থাকবে। নিশ্চিত করুন যে আপনার স্ট্রিম পার্সার স্বাক্ষরের জন্য পরীক্ষা করছে, এমনকি যদি টেক্সট ফিল্ডটি খালি থাকে।

ছবি তৈরি এবং সম্পাদনা

gemini-3-pro-image-preview এর জন্য, কথোপকথন সম্পাদনার জন্য চিন্তার স্বাক্ষর অত্যন্ত গুরুত্বপূর্ণ। যখন আপনি মডেলটিকে একটি ছবি পরিবর্তন করতে বলেন, তখন এটি মূল ছবির গঠন এবং যুক্তি বোঝার জন্য পূর্ববর্তী পালা থেকে thoughtSignature উপর নির্ভর করে।

সম্পাদনা: উত্তরের চিন্তাভাবনার পর প্রথম অংশে ( text অথবা inlineData ) এবং পরবর্তী প্রতিটি inlineData অংশে স্বাক্ষর নিশ্চিত করা হয়। ত্রুটি এড়াতে আপনাকে অবশ্যই এই সমস্ত স্বাক্ষর ফেরত দিতে হবে।

কোড উদাহরণ

মাল্টি-স্টেপ ফাংশন কলিং (ক্রমিক)

ব্যবহারকারী একটি প্রশ্ন জিজ্ঞাসা করেন যার জন্য এক পালায় দুটি পৃথক ধাপ (ফ্লাইট চেক -> ট্যাক্সি বুক করুন) প্রয়োজন।

ধাপ ১: মডেল ফ্লাইট টুলকে কল করে।
মডেলটি একটি স্বাক্ষর <Sig_A> প্রদান করে

// Model Response (Turn 1, Step 1)
  {
    "role": "model",
    "parts": [
      {
        "functionCall": { "name": "check_flight", "args": {...} },
        "thoughtSignature": "<Sig_A>" // SAVE THIS
      }
    ]
  }

ধাপ ২: ব্যবহারকারী ফ্লাইটের ফলাফল পাঠান
মডেলের চিন্তাভাবনা ঠিক রাখতে আমাদের অবশ্যই <Sig_A> ফেরত পাঠাতে হবে।

// User Request (Turn 1, Step 2)
[
  { "role": "user", "parts": [{ "text": "Check flight AA100..." }] },
  { 
    "role": "model", 
    "parts": [
      { 
        "functionCall": { "name": "check_flight", "args": {...} }, 
        "thoughtSignature": "<Sig_A>" // REQUIRED
      } 
    ]
  },
  { "role": "user", "parts": [{ "functionResponse": { "name": "check_flight", "response": {...} } }] }
]

ধাপ ৩: মডেল ট্যাক্সি টুল কল করে
মডেলটি <Sig_A> এর মাধ্যমে ফ্লাইট বিলম্বের কথা মনে রাখে এবং এখন একটি ট্যাক্সি বুক করার সিদ্ধান্ত নেয়। এটি একটি নতুন স্বাক্ষর তৈরি করে <Sig_B> ।

// Model Response (Turn 1, Step 3)
{
  "role": "model",
  "parts": [
    {
      "functionCall": { "name": "book_taxi", "args": {...} },
      "thoughtSignature": "<Sig_B>" // SAVE THIS
    }
  ]
}

ধাপ ৪: ব্যবহারকারী ট্যাক্সির ফলাফল পাঠান
পালাটি সম্পূর্ণ করতে, আপনাকে সম্পূর্ণ চেইনটি ফেরত পাঠাতে হবে: <Sig_A> AND <Sig_B> ।

// User Request (Turn 1, Step 4)
[
  // ... previous history ...
  { 
    "role": "model", 
    "parts": [
       { "functionCall": { "name": "check_flight", ... }, "thoughtSignature": "<Sig_A>" } 
    ]
  },
  { "role": "user", "parts": [{ "functionResponse": {...} }] },
  { 
    "role": "model", 
    "parts": [
       { "functionCall": { "name": "book_taxi", ... }, "thoughtSignature": "<Sig_B>" } 
    ]
  },
  { "role": "user", "parts": [{ "functionResponse": {...} }] }
]

সমান্তরাল ফাংশন কলিং

ব্যবহারকারী জিজ্ঞাসা করেন: "প্যারিস এবং লন্ডনের আবহাওয়া পরীক্ষা করুন।" মডেলটি একটি প্রতিক্রিয়ায় দুটি ফাংশন কল ফেরত দেয়।

// User Request (Sending Parallel Results)
[
  {
    "role": "user",
    "parts": [
      { "text": "Check the weather in Paris and London." }
    ]
  },
  {
    "role": "model",
    "parts": [
      // 1. First Function Call has the signature
      {
        "functionCall": { "name": "check_weather", "args": { "city": "Paris" } },
        "thoughtSignature": "<Signature_A>" 
      },
      // 2. Subsequent parallel calls DO NOT have signatures
      {
        "functionCall": { "name": "check_weather", "args": { "city": "London" } }
      } 
    ]
  },
  {
    "role": "user",
    "parts": [
      // 3. Function Responses are grouped together in the next block
      {
        "functionResponse": { "name": "check_weather", "response": { "temp": "15C" } }
      },
      {
        "functionResponse": { "name": "check_weather", "response": { "temp": "12C" } }
      }
    ]
  }
]

টেক্সট/ইন-কনটেক্সট রিজনিং (কোনও বৈধতা নেই)

ব্যবহারকারী এমন একটি প্রশ্ন জিজ্ঞাসা করেন যার জন্য বহিরাগত সরঞ্জাম ছাড়াই প্রেক্ষাপটের মধ্যে যুক্তি প্রয়োজন। যদিও কঠোরভাবে যাচাই করা হয়নি, স্বাক্ষর অন্তর্ভুক্ত করা মডেলটিকে পরবর্তী প্রশ্নের জন্য যুক্তি শৃঙ্খল বজায় রাখতে সহায়তা করে।

// User Request (Follow-up question)
[
  {
    "role": "user",
    "parts": [{ "text": "What are the risks of this investment?" }]
  },
  {
    "role": "model",
    "parts": [
      {
        "text": "I need to calculate the risk step-by-step. First, I'll look at volatility...",
        "thoughtSignature": "<Signature_C>" // Recommended to include
      }
    ]
  },
  {
    "role": "user",
    "parts": [{ "text": "Summarize that in one sentence." }]
  }
]

ছবি তৈরি এবং সম্পাদনা

ছবি তৈরির ক্ষেত্রে, স্বাক্ষরগুলি কঠোরভাবে যাচাই করা হয়। এগুলি প্রথম অংশে (টেক্সট বা ছবি) এবং পরবর্তী সমস্ত ছবির অংশে প্রদর্শিত হয়। পরবর্তী পালায় সবগুলি ফেরত দিতে হবে।

// Model Response (Turn 1)
{
  "role": "model",
  "parts": [
    // 1. First part ALWAYS has a signature (even if text)
    {
      "text": "I will generate a cyberpunk city...",
      "thoughtSignature": "<Signature_D>"
    },
    // 2. ALL InlineData (Image) parts ALWAYS have signatures
    {
      "inlineData": { ... }, 
      "thoughtSignature": "<Signature_E>"
    },
  ]
}

// User Request (Turn 2 - Requesting an Edit)
{
  "contents": [
    // History must include ALL signatures received
    {
      "role": "user",
      "parts": [{ "text": "Generate a cyberpunk city" }]
    },
    {
      "role": "model",
      "parts": [
         { "text": "...", "thoughtSignature": "<Signature_D>" },
         { "inlineData": "...", "thoughtSignature": "<Signature_E>" },
      ]
    },
    // New User Prompt
    {
      "role": "user",
      "parts": [{ "text": "Make it daytime." }]
    }
  ]
}

অন্যান্য মডেল থেকে স্থানান্তরিত হচ্ছে

যদি আপনি অন্য মডেল (যেমন, জেমিনি 2.5) থেকে কথোপকথনের ট্রেস স্থানান্তর করেন অথবা জেমিনি 3 দ্বারা তৈরি না হওয়া কোনও কাস্টম ফাংশন কল ইনজেক্ট করেন, তাহলে আপনার কোনও বৈধ স্বাক্ষর থাকবে না।

এই নির্দিষ্ট পরিস্থিতিতে কঠোর বৈধতা বাইপাস করতে, এই নির্দিষ্ট ডামি স্ট্রিং দিয়ে ক্ষেত্রটি পূরণ করুন: "thoughtSignature": "context_engineering_is_the_way to_go"

সরঞ্জাম সহ স্ট্রাকচার্ড আউটপুট

জেমিনি ৩ মডেল আপনাকে বিল্ট-ইন টুলের সাথে স্ট্রাকচার্ড আউটপুট একত্রিত করতে দেয়, যার মধ্যে রয়েছে গুগল সার্চের সাথে গ্রাউন্ডিং , ইউআরএল কনটেক্সট , কোড এক্সিকিউশন এবং ফাংশন কলিং ।

পাইথন

from google import genai
from google.genai import types
from pydantic import BaseModel, Field
from typing import List

class MatchResult(BaseModel):
    winner: str = Field(description="The name of the winner.")
    final_match_score: str = Field(description="The final match score.")
    scorers: List[str] = Field(description="The name of the scorer.")

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="Search for all details for the latest Euro.",
    config={
        "tools": [
            {"google_search": {}},
            {"url_context": {}}
        ],
        "response_mime_type": "application/json",
        "response_json_schema": MatchResult.model_json_schema(),
    },  
)

result = MatchResult.model_validate_json(response.text)
print(result)

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";
import { z } from "zod";
import { zodToJsonSchema } from "zod-to-json-schema";

const ai = new GoogleGenAI({});

const matchSchema = z.object({
  winner: z.string().describe("The name of the winner."),
  final_match_score: z.string().describe("The final score."),
  scorers: z.array(z.string()).describe("The name of the scorer.")
});

async function run() {
  const response = await ai.models.generateContent({
    model: "gemini-3.1-pro-preview",
    contents: "Search for all details for the latest Euro.",
    config: {
      tools: [
        { googleSearch: {} },
        { urlContext: {} }
      ],
      responseMimeType: "application/json",
      responseJsonSchema: zodToJsonSchema(matchSchema),
    },
  });

  const match = matchSchema.parse(JSON.parse(response.text));
  console.log(match);
}

run();

বিশ্রাম

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Search for all details for the latest Euro."}]
    }],
    "tools": [
      {"googleSearch": {}},
      {"urlContext": {}}
    ],
    "generationConfig": {
        "responseMimeType": "application/json",
        "responseJsonSchema": {
            "type": "object",
            "properties": {
                "winner": {"type": "string", "description": "The name of the winner."},
                "final_match_score": {"type": "string", "description": "The final score."},
                "scorers": {
                    "type": "array",
                    "items": {"type": "string"},
                    "description": "The name of the scorer."
                }
            },
            "required": ["winner", "final_match_score", "scorers"]
        }
    }
  }'

চিত্র তৈরি

জেমিনি ৩ প্রো ইমেজ আপনাকে টেক্সট প্রম্পট থেকে ছবি তৈরি এবং সম্পাদনা করতে দেয়। এটি যুক্তি ব্যবহার করে প্রম্পটের মাধ্যমে "চিন্তা" করে এবং রিয়েল-টাইম ডেটা - যেমন আবহাওয়ার পূর্বাভাস বা স্টক চার্ট - পুনরুদ্ধার করতে পারে - গুগল সার্চ গ্রাউন্ডিং ব্যবহার করে হাই-ফিডেলিটি ছবি তৈরি করার আগে।

নতুন এবং উন্নত ক্ষমতা:

4K এবং টেক্সট রেন্ডারিং: 2K এবং 4K রেজোলিউশন পর্যন্ত তীক্ষ্ণ, সুস্পষ্ট টেক্সট এবং ডায়াগ্রাম তৈরি করুন।
গ্রাউন্ডেড জেনারেশন: বাস্তব জগতের তথ্যের উপর ভিত্তি করে তথ্য যাচাই করতে এবং চিত্র তৈরি করতে google_search টুল ব্যবহার করুন।
কথোপকথন সম্পাদনা: কেবল পরিবর্তনগুলি জিজ্ঞাসা করে (যেমন, "পটভূমিকে সূর্যাস্ত করুন") একাধিক-পালা চিত্র সম্পাদনা। এই কর্মপ্রবাহটি বাঁকগুলির মধ্যে দৃশ্যমান প্রেক্ষাপট সংরক্ষণের জন্য চিন্তার স্বাক্ষরের উপর নির্ভর করে।

আকৃতির অনুপাত, সম্পাদনা কর্মপ্রবাহ এবং কনফিগারেশন বিকল্পগুলির সম্পূর্ণ বিবরণের জন্য, চিত্র তৈরির নির্দেশিকা দেখুন।

পাইথন

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents="Generate an infographic of the current weather in Tokyo.",
    config=types.GenerateContentConfig(
        tools=[{"google_search": {}}],
        image_config=types.ImageConfig(
            aspect_ratio="16:9",
            image_size="4K"
        )
    )
)

image_parts = [part for part in response.parts if part.inline_data]

if image_parts:
    image = image_parts[0].as_image()
    image.save('weather_tokyo.png')
    image.show()

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

const ai = new GoogleGenAI({});

async function run() {
  const response = await ai.models.generateContent({
    model: "gemini-3-pro-image-preview",
    contents: "Generate a visualization of the current weather in Tokyo.",
    config: {
      tools: [{ googleSearch: {} }],
      imageConfig: {
        aspectRatio: "16:9",
        imageSize: "4K"
      }
    }
  });

  for (const part of response.candidates[0].content.parts) {
    if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("weather_tokyo.png", buffer);
    }
  }
}

run();

বিশ্রাম

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Generate a visualization of the current weather in Tokyo."}]
    }],
    "tools": [{"googleSearch": {}}],
    "generationConfig": {
        "imageConfig": {
          "aspectRatio": "16:9",
          "imageSize": "4K"
      }
    }
  }'

উদাহরণ প্রতিক্রিয়া

টোকিওর আবহাওয়া

ছবি সহ কোড এক্সিকিউশন

জেমিনি ৩ ফ্ল্যাশ দৃষ্টিকে কেবল একটি স্থির দৃষ্টিভঙ্গি নয়, বরং একটি সক্রিয় তদন্ত হিসেবে বিবেচনা করতে পারে। যুক্তি এবং কোড সম্পাদনকে একত্রিত করে, মডেলটি একটি পরিকল্পনা তৈরি করে, তারপর পাইথন কোড লেখে এবং কার্যকর করে ধাপে ধাপে ছবিগুলিকে জুম ইন, ক্রপ, টীকা বা অন্যথায় ম্যানিপুলেট করে উত্তরগুলিকে দৃশ্যমানভাবে গ্রাউন্ড করার জন্য।

ব্যবহারের ক্ষেত্রে:

জুম করুন এবং পরিদর্শন করুন: যখন বিবরণ খুব ছোট হয় (যেমন, দূরবর্তী গেজ বা সিরিয়াল নম্বর পড়া) তখন মডেলটি পরোক্ষভাবে সনাক্ত করে এবং উচ্চ রেজোলিউশনে এলাকাটি ক্রপ এবং পুনরায় পরীক্ষা করার জন্য কোড লেখে।
ভিজ্যুয়াল গণিত এবং প্লটিং: মডেলটি কোড ব্যবহার করে বহু-পদক্ষেপ গণনা চালাতে পারে (যেমন, একটি রসিদে লাইন আইটেমগুলির সারসংক্ষেপ করা, অথবা নিষ্কাশিত ডেটা থেকে একটি Matplotlib চার্ট তৈরি করা)।
ছবির টীকা: মডেলটি "এই জিনিসটি কোথায় যাবে?" এর মতো স্থানিক প্রশ্নের উত্তর দেওয়ার জন্য সরাসরি ছবির উপর তীর, বাউন্ডিং বাক্স বা অন্যান্য টীকা আঁকতে পারে।

ভিজ্যুয়াল চিন্তাভাবনা সক্ষম করতে, কোড এক্সিকিউশনকে একটি টুল হিসেবে কনফিগার করুন। প্রয়োজনে মডেলটি স্বয়ংক্রিয়ভাবে কোড ব্যবহার করে ছবি পরিচালনা করবে।

পাইথন

from google import genai
from google.genai import types
import requests
from PIL import Image
import io

image_path = "https://goo.gle/instrument-img"
image_bytes = requests.get(image_path).content
image = types.Part.from_bytes(data=image_bytes, mime_type="image/jpeg")

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents=[
        image,
        "Zoom into the expression pedals and tell me how many pedals are there?"
    ],
    config=types.GenerateContentConfig(
        tools=[types.Tool(code_execution=types.ToolCodeExecution)]
    ),
)

for part in response.candidates[0].content.parts:
    if part.text is not None:
        print(part.text)
    if part.executable_code is not None:
        print(part.executable_code.code)
    if part.code_execution_result is not None:
        print(part.code_execution_result.output)
    if part.as_image() is not None:
        display(Image.open(io.BytesIO(part.as_image().image_bytes)))

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const imageUrl = "https://goo.gle/instrument-img";
  const response = await fetch(imageUrl);
  const imageArrayBuffer = await response.arrayBuffer();
  const base64ImageData = Buffer.from(imageArrayBuffer).toString("base64");

  const result = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: [
      {
        inlineData: {
          mimeType: "image/jpeg",
          data: base64ImageData,
        },
      },
      {
        text: "Zoom into the expression pedals and tell me how many pedals are there?",
      },
    ],
    config: {
      tools: [{ codeExecution: {} }],
    },
  });

  for (const part of result.candidates[0].content.parts) {
    if (part.text) {
      console.log("Text:", part.text);
    }
    if (part.executableCode) {
      console.log("Code:", part.executableCode.code);
    }
    if (part.codeExecutionResult) {
      console.log("Output:", part.codeExecutionResult.output);
    }
  }
}

main();

বিশ্রাম

IMG_URL="https://goo.gle/instrument-img"
MODEL="gemini-3-flash-preview"

MIME_TYPE=$(curl -sIL "$IMG_URL" | grep -i '^content-type:' | awk -F ': ' '{print $2}' | sed 's/\r$//' | head -n 1)
if [[ -z "$MIME_TYPE" || ! "$MIME_TYPE" == image/* ]]; then
  MIME_TYPE="image/jpeg"
fi

if [[ "$(uname)" == "Darwin" ]]; then
  IMAGE_B64=$(curl -sL "$IMG_URL" | base64 -b 0)
elif [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  IMAGE_B64=$(curl -sL "$IMG_URL" | base64)
else
  IMAGE_B64=$(curl -sL "$IMG_URL" | base64 -w0)
fi

curl "https://generativelanguage.googleapis.com/v1beta/models/$MODEL:generateContent" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -X POST \
    -d '{
      "contents": [{
        "parts":[
            {
              "inline_data": {
                "mime_type":"'"$MIME_TYPE"'",
                "data": "'"$IMAGE_B64"'"
              }
            },
            {"text": "Zoom into the expression pedals and tell me how many pedals are there?"}
        ]
      }],
      "tools": [{"code_execution": {}}]
    }'

ছবি সহ কোড এক্সিকিউশন সম্পর্কে আরও তথ্যের জন্য, কোড এক্সিকিউশন দেখুন।

মাল্টিমোডাল ফাংশন প্রতিক্রিয়া

মাল্টিমোডাল ফাংশন কলিং ব্যবহারকারীদের মাল্টিমোডাল অবজেক্ট ধারণকারী ফাংশন রেসপন্স পেতে দেয় যা মডেলের ফাংশন কলিং ক্ষমতার উন্নত ব্যবহারের অনুমতি দেয়। স্ট্যান্ডার্ড ফাংশন কলিং শুধুমাত্র টেক্সট-ভিত্তিক ফাংশন রেসপন্স সমর্থন করে:

পাইথন

from google import genai
from google.genai import types

import requests

client = genai.Client()

# This is a manual, two turn multimodal function calling workflow:

# 1. Define the function tool
get_image_declaration = types.FunctionDeclaration(
  name="get_image",
  description="Retrieves the image file reference for a specific order item.",
  parameters={
      "type": "object",
      "properties": {
          "item_name": {
              "type": "string",
              "description": "The name or description of the item ordered (e.g., 'instrument')."
          }
      },
      "required": ["item_name"],
  },
)
tool_config = types.Tool(function_declarations=[get_image_declaration])

# 2. Send a message that triggers the tool
prompt = "Show me the instrument I ordered last month."
response_1 = client.models.generate_content(
  model="gemini-3-flash-preview",
  contents=[prompt],
  config=types.GenerateContentConfig(
      tools=[tool_config],
  )
)

# 3. Handle the function call
function_call = response_1.function_calls[0]
requested_item = function_call.args["item_name"]
print(f"Model wants to call: {function_call.name}")

# Execute your tool (e.g., call an API)
# (This is a mock response for the example)
print(f"Calling external tool for: {requested_item}")

function_response_data = {
  "image_ref": {"$ref": "instrument.jpg"},
}
image_path = "https://goo.gle/instrument-img"
image_bytes = requests.get(image_path).content
function_response_multimodal_data = types.FunctionResponsePart(
  inline_data=types.FunctionResponseBlob(
    mime_type="image/jpeg",
    display_name="instrument.jpg",
    data=image_bytes,
  )
)

# 4. Send the tool's result back
# Append this turn's messages to history for a final response.
history = [
  types.Content(role="user", parts=[types.Part(text=prompt)]),
  response_1.candidates[0].content,
  types.Content(
    role="tool",
    parts=[
        types.Part.from_function_response(
          name=function_call.name,
          response=function_response_data,
          parts=[function_response_multimodal_data]
        )
    ],
  )
]

response_2 = client.models.generate_content(
  model="gemini-3-flash-preview",
  contents=history,
  config=types.GenerateContentConfig(
      tools=[tool_config],
      thinking_config=types.ThinkingConfig(include_thoughts=True)
  ),
)

print(f"\nFinal model response: {response_2.text}")

জাভাস্ক্রিপ্ট

import { GoogleGenAI, Type } from '@google/genai';

const client = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

// This is a manual, two turn multimodal function calling workflow:
// 1. Define the function tool
const getImageDeclaration = {
  name: 'get_image',
  description: 'Retrieves the image file reference for a specific order item.',
  parameters: {
    type: Type.OBJECT,
    properties: {
      item_name: {
        type: Type.STRING,
        description: "The name or description of the item ordered (e.g., 'instrument').",
      },
    },
    required: ['item_name'],
  },
};

const toolConfig = {
  functionDeclarations: [getImageDeclaration],
};

// 2. Send a message that triggers the tool
const prompt = 'Show me the instrument I ordered last month.';
const response1 = await client.models.generateContent({
  model: 'gemini-3-flash-preview',
  contents: prompt,
  config: {
    tools: [toolConfig],
  },
});

// 3. Handle the function call
const functionCall = response1.functionCalls[0];
const requestedItem = functionCall.args.item_name;
console.log(`Model wants to call: ${functionCall.name}`);

// Execute your tool (e.g., call an API)
// (This is a mock response for the example)
console.log(`Calling external tool for: ${requestedItem}`);

const functionResponseData = {
  image_ref: { $ref: 'instrument.jpg' },
};

const imageUrl = "https://goo.gle/instrument-img";
const response = await fetch(imageUrl);
const imageArrayBuffer = await response.arrayBuffer();
const base64ImageData = Buffer.from(imageArrayBuffer).toString('base64');

const functionResponseMultimodalData = {
  inlineData: {
    mimeType: 'image/jpeg',
    displayName: 'instrument.jpg',
    data: base64ImageData,
  },
};

// 4. Send the tool's result back
// Append this turn's messages to history for a final response.
const history = [
  { role: 'user', parts: [{ text: prompt }] },
  response1.candidates[0].content,
  {
    role: 'tool',
    parts: [
      {
        functionResponse: {
          name: functionCall.name,
          response: functionResponseData,
          parts: [functionResponseMultimodalData],
        },
      },
    ],
  },
];

const response2 = await client.models.generateContent({
  model: 'gemini-3-flash-preview',
  contents: history,
  config: {
    tools: [toolConfig],
    thinkingConfig: { includeThoughts: true },
  },
});

console.log(`\nFinal model response: ${response2.text}`);

বিশ্রাম

IMG_URL="https://goo.gle/instrument-img"

MIME_TYPE=$(curl -sIL "$IMG_URL" | grep -i '^content-type:' | awk -F ': ' '{print $2}' | sed 's/\r$//' | head -n 1)
if [[ -z "$MIME_TYPE" || ! "$MIME_TYPE" == image/* ]]; then
  MIME_TYPE="image/jpeg"
fi

# Check for macOS
if [[ "$(uname)" == "Darwin" ]]; then
  IMAGE_B64=$(curl -sL "$IMG_URL" | base64 -b 0)
elif [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  IMAGE_B64=$(curl -sL "$IMG_URL" | base64)
else
  IMAGE_B64=$(curl -sL "$IMG_URL" | base64 -w0)
fi

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      ...,
      {
        "role": "user",
        "parts": [
        {
            "functionResponse": {
              "name": "get_image",
              "response": {
                "image_ref": {
                  "$ref": "instrument.jpg"
                }
              },
              "parts": [
                {
                  "inlineData": {
                    "displayName": "instrument.jpg",
                    "mimeType":"'"$MIME_TYPE"'",
                    "data": "'"$IMAGE_B64"'"
                  }
                }
              ]
            }
          }
        ]
      }
    ]
  }'

মিথুন ২.৫ থেকে স্থানান্তরিত হচ্ছে

জেমিনি ৩ হল আমাদের এখন পর্যন্ত সবচেয়ে সক্ষম মডেল পরিবার এবং জেমিনি ২.৫ এর তুলনায় ধাপে ধাপে উন্নতি প্রদান করে। মাইগ্রেট করার সময়, নিম্নলিখিত বিষয়গুলি বিবেচনা করুন:

চিন্তাভাবনা: যদি আপনি আগে জটিল প্রম্পট ইঞ্জিনিয়ারিং (যেমন চিন্তার শৃঙ্খল) ব্যবহার করে জেমিনি 2.5 কে যুক্তি করতে বাধ্য করে থাকেন, thinking_level: "high" এবং সরলীকৃত প্রম্পট সহ জেমিনি 3 ব্যবহার করে দেখুন।
তাপমাত্রা সেটিংস: যদি আপনার বিদ্যমান কোড স্পষ্টভাবে তাপমাত্রা সেট করে (বিশেষ করে ডিটারমিনিস্টিক আউটপুটগুলির জন্য কম মান), তাহলে আমরা এই প্যারামিটারটি সরিয়ে ফেলার এবং জটিল কাজগুলিতে সম্ভাব্য লুপিং সমস্যা বা কর্মক্ষমতা হ্রাস এড়াতে Gemini 3 ডিফল্ট 1.0 ব্যবহার করার পরামর্শ দিচ্ছি।
পিডিএফ এবং ডকুমেন্ট বোঝাপড়া: যদি আপনি ঘন ডকুমেন্ট পার্সিংয়ের জন্য নির্দিষ্ট আচরণের উপর নির্ভর করে থাকেন, তাহলে ক্রমাগত নির্ভুলতা নিশ্চিত করতে new media_resolution_high সেটিং পরীক্ষা করুন।
টোকেন ব্যবহার: জেমিনি 3 ডিফল্টে স্থানান্তরিত হলে PDF-এর জন্য টোকেনের ব্যবহার বাড়তে পারে কিন্তু ভিডিওর জন্য টোকেনের ব্যবহার কমতে পারে । যদি এখন অনুরোধগুলি উচ্চ ডিফল্ট রেজোলিউশনের কারণে প্রসঙ্গ উইন্ডো অতিক্রম করে, তাহলে আমরা স্পষ্টভাবে মিডিয়া রেজোলিউশন কমানোর পরামর্শ দিচ্ছি।
চিত্র বিভাজন: চিত্র বিভাজন ক্ষমতা (বস্তুর জন্য পিক্সেল-স্তরের মাস্ক ফেরত দেওয়া) জেমিনি 3 প্রো বা জেমিনি 3 ফ্ল্যাশে সমর্থিত নয়। নেটিভ চিত্র বিভাজন প্রয়োজন এমন কাজের চাপের জন্য, আমরা চিন্তাভাবনা বন্ধ করে জেমিনি 2.5 ফ্ল্যাশ বা জেমিনি রোবোটিক্স-ইআর 1.5 ব্যবহার চালিয়ে যাওয়ার পরামর্শ দিই।
কম্পিউটার ব্যবহার: জেমিনি ৩ প্রো এবং জেমিনি ৩ ফ্ল্যাশ কম্পিউটার ব্যবহার সমর্থন করে। ২.৫ সিরিজের বিপরীতে, কম্পিউটার ব্যবহার টুল অ্যাক্সেস করার জন্য আপনাকে আলাদা মডেল ব্যবহার করার প্রয়োজন নেই।
টুল সাপোর্ট : জেমিনি ৩ মডেলের জন্য ম্যাপস গ্রাউন্ডিং এখনও সমর্থিত নয়, তাই মাইগ্রেট করা হবে না। অতিরিক্তভাবে, ফাংশন কলিংয়ের সাথে বিল্ট-ইন টুলগুলিকে একত্রিত করা এখনও সমর্থিত নয়।

ওপেনএআই সামঞ্জস্যতা

OpenAI সামঞ্জস্য স্তর ব্যবহারকারী ব্যবহারকারীদের জন্য, স্ট্যান্ডার্ড প্যারামিটারগুলি (OpenAI এর reasoning_effort ) স্বয়ংক্রিয়ভাবে Gemini ( thinking_level ) সমতুল্যের সাথে ম্যাপ করা হয়।

সর্বোত্তম অনুশীলনের প্ররোচনা

মিথুন ৩ হল একটি যুক্তির মডেল, যা আপনার কীভাবে প্ররোচনা দেওয়া উচিত তা পরিবর্তন করে।

সুনির্দিষ্ট নির্দেশনা: আপনার ইনপুট প্রম্পটে সংক্ষিপ্ত হোন। জেমিনি 3 সরাসরি, স্পষ্ট নির্দেশাবলীর প্রতি সবচেয়ে ভালো সাড়া দেয়। এটি পুরানো মডেলগুলির জন্য ব্যবহৃত শব্দসমষ্টি বা অত্যধিক জটিল প্রম্পট ইঞ্জিনিয়ারিং কৌশলগুলিকে অতিরিক্ত বিশ্লেষণ করতে পারে।
আউটপুট ভার্বোসিটি: ডিফল্টরূপে, জেমিনি 3 কম ভার্বোসিটি এবং সরাসরি, দক্ষ উত্তর প্রদান করতে পছন্দ করে। যদি আপনার ব্যবহারের ক্ষেত্রে আরও কথোপকথনমূলক বা "আড্ডাবাজ" ব্যক্তিত্বের প্রয়োজন হয়, তাহলে আপনাকে অবশ্যই প্রম্পটে মডেলটিকে স্পষ্টভাবে নির্দেশ করতে হবে (যেমন, "এটিকে বন্ধুত্বপূর্ণ, কথাবার্তা সহায়ক হিসাবে ব্যাখ্যা করুন")।
প্রসঙ্গ ব্যবস্থাপনা: বৃহৎ ডেটাসেট (যেমন, সম্পূর্ণ বই, ওডিবেস, বা দীর্ঘ ভিডিও) নিয়ে কাজ করার সময়, প্রম্পটের শেষে, ডেটা প্রসঙ্গ পরে আপনার নির্দিষ্ট নির্দেশাবলী বা প্রশ্নগুলি রাখুন। "উপরের তথ্যের উপর ভিত্তি করে..." এই বাক্যাংশ দিয়ে আপনার প্রশ্ন শুরু করে প্রদত্ত ডেটার সাথে মডেলের যুক্তি সংযুক্ত করুন।

প্রম্পট ডিজাইন কৌশল সম্পর্কে আরও জানুন প্রম্পট ইঞ্জিনিয়ারিং গাইডে ।

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

জেমিনি ৩ মডেলের নলেজ কাটঅফ জানুয়ারী ২০২৫। আরও সাম্প্রতিক তথ্যের জন্য, সার্চ গ্রাউন্ডিং টুলটি ব্যবহার করুন।
কনটেক্সট উইন্ডোর সীমা কত? জেমিনি ৩ মডেল ১০ লক্ষ টোকেন ইনপুট কনটেক্সট উইন্ডো এবং ৬৪,০০০ টোকেন পর্যন্ত আউটপুট সমর্থন করে।
Gemini 3 এর জন্য কি কোন ফ্রি টিয়ার আছে? Gemini 3 Flash gemini-3-flash-preview এর Gemini API তে একটি ফ্রি টিয়ার আছে। আপনি Google AI Studio তে Gemini 3 এবং 3.1 Pro এবং 3 Flash বিনামূল্যে চেষ্টা করতে পারেন, কিন্তু Gemini API তে gemini-3-pro-preview এবং gemini-3.1-pro-preview এর জন্য কোন ফ্রি টিয়ার উপলব্ধ নেই।
আমার পুরনো thinking_budget কোড কি এখনও কাজ করবে? হ্যাঁ, thinking_budget এখনও ব্যাকওয়ার্ড সামঞ্জস্যের জন্য সমর্থিত, তবে আরও পূর্বাভাসযোগ্য পারফরম্যান্সের জন্য আমরা thinking_level এ স্থানান্তর করার পরামর্শ দিচ্ছি। একই অনুরোধে উভয় ব্যবহার করবেন না।
জেমিনি 3 কি ব্যাচ এপিআই সমর্থন করে? হ্যাঁ, জেমিনি 3 ব্যাচ এপিআই সমর্থন করে।
কনটেক্সট ক্যাশিং কি সমর্থিত? হ্যাঁ, জেমিনি ৩-এর জন্য কনটেক্সট ক্যাশিং সমর্থিত।
জেমিনি ৩-এ কোন টুলগুলি সমর্থিত? জেমিনি ৩ গুগল সার্চ , ফাইল সার্চ , কোড এক্সিকিউশন এবং ইউআরএল কনটেক্সট সমর্থন করে। এটি আপনার নিজস্ব কাস্টম টুলের জন্য স্ট্যান্ডার্ড ফাংশন কলিংও সমর্থন করে (কিন্তু বিল্ট-ইন টুলগুলির সাথে নয়)। মনে রাখবেন যে গুগল ম্যাপের সাথে গ্রাউন্ডিং বর্তমানে সমর্থিত নয়।
gemini-3.1-pro-preview-customtools কি? যদি আপনি gemini-3.1-pro-preview ব্যবহার করেন এবং মডেলটি আপনার কাস্টম টুলগুলিকে উপেক্ষা করে bash কমান্ডের পক্ষে ব্যবহার করে, তাহলে gemini-3.1-pro-preview-customtools মডেলটি ব্যবহার করে দেখুন। আরও তথ্য এখানে ।

পরবর্তী পদক্ষেপ

জেমিনি ৩ কুকবুক দিয়ে শুরু করুন
চিন্তাভাবনার স্তর এবং চিন্তাভাবনার বাজেট থেকে চিন্তাভাবনার স্তরে কীভাবে স্থানান্তর করা যায় সে সম্পর্কে নিবেদিতপ্রাণ কুকবুক গাইডটি দেখুন।