জেমিনি ডিপ রিসার্চ এজেন্ট স্বয়ংক্রিয়ভাবে বহু-ধাপের গবেষণামূলক কাজ পরিকল্পনা, সম্পাদন এবং সংশ্লেষণ করে। জেমিনির শক্তিতে চালিত হয়ে, এটি জটিল তথ্য-জগৎ পরিভ্রমণ করে বিশদ ও তথ্যসূত্র-সহ প্রতিবেদন তৈরি করে। এর নতুন সক্ষমতাগুলো আপনাকে এজেন্টের সাথে যৌথভাবে পরিকল্পনা করতে, এমসিপি সার্ভার ব্যবহার করে বাহ্যিক টুলের সাথে সংযোগ স্থাপন করতে, ভিজ্যুয়ালাইজেশন (যেমন চার্ট ও গ্রাফ) অন্তর্ভুক্ত করতে এবং সরাসরি ইনপুট হিসেবে ডকুমেন্ট সরবরাহ করতে সাহায্য করে।
গবেষণামূলক কাজগুলিতে পুনরাবৃত্তিমূলক অনুসন্ধান এবং পঠন জড়িত থাকে এবং এটি সম্পন্ন হতে কয়েক মিনিট সময় লাগতে পারে। এজেন্টকে অ্যাসিঙ্ক্রোনাসভাবে চালাতে এবং ফলাফলের জন্য পোল করতে বা আপডেট স্ট্রিম করতে আপনাকে অবশ্যই ব্যাকগ্রাউন্ড এক্সিকিউশন ( background=true সেট করুন) ব্যবহার করতে হবে। আরও বিস্তারিত জানার জন্য ‘দীর্ঘস্থায়ী কাজ পরিচালনা’ দেখুন।
নিম্নলিখিত উদাহরণটি দেখায় কিভাবে পটভূমিতে একটি গবেষণা কাজ শুরু করতে হয় এবং ফলাফলের জন্য মতামত নিতে হয়।
পাইথন
import time
from google import genai
client = genai.Client()
interaction = client.interactions.create(
input="Research the history of Google TPUs.",
agent="deep-research-preview-04-2026",
background=True,
)
print(f"Research started: {interaction.id}")
while True:
interaction = client.interactions.get(interaction.id)
if interaction.status == "completed":
print(interaction.outputs[-1].text)
break
elif interaction.status == "failed":
print(f"Research failed: {interaction.error}")
break
time.sleep(10)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from '@google/genai';
const client = new GoogleGenAI({});
const interaction = await client.interactions.create({
input: 'Research the history of Google TPUs.',
agent: 'deep-research-preview-04-2026',
background: true
});
console.log(`Research started: ${interaction.id}`);
while (true) {
const result = await client.interactions.get(interaction.id);
if (result.status === 'completed') {
console.log(result.outputs[result.outputs.length - 1].text);
break;
} else if (result.status === 'failed') {
console.log(`Research failed: ${result.error}`);
break;
}
await new Promise(resolve => setTimeout(resolve, 10000));
}
বিশ্রাম
# 1. Start the research task
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": "Research the history of Google TPUs.",
"agent": "deep-research-preview-04-2026",
"background": true
}'
# 2. Poll for results (Replace INTERACTION_ID)
# curl -X GET "https://generativelanguage.googleapis.com/v1beta/interactions/INTERACTION_ID" \
# -H "x-goog-api-key: $GEMINI_API_KEY"
সমর্থিত সংস্করণ
ডিপ রিসার্চ এজেন্টটি দুটি সংস্করণে পাওয়া যায়:
- গভীর গবেষণা (
deep-research-preview-04-2026): গতি এবং দক্ষতার জন্য ডিজাইন করা, ক্লায়েন্ট UI-তে স্ট্রিম করার জন্য আদর্শ। - ডিপ রিসার্চ ম্যাক্স (
deep-research-max-preview-04-2026): স্বয়ংক্রিয়ভাবে প্রেক্ষাপট সংগ্রহ এবং সংশ্লেষণের জন্য সর্বোচ্চ ব্যাপকতা।
সহযোগিতামূলক পরিকল্পনা
সহযোগিতামূলক পরিকল্পনা আপনাকে এজেন্টের কাজ শুরু করার আগেই গবেষণার দিকনির্দেশনার উপর নিয়ন্ত্রণ দেয়। এটি সক্রিয় করা হলে, এজেন্ট অবিলম্বে কাজ শুরু না করে একটি প্রস্তাবিত গবেষণা পরিকল্পনা ফেরত দেয়। এরপর আপনি একাধিক টার্নের ইন্টারঅ্যাকশনের মাধ্যমে পরিকল্পনাটি পর্যালোচনা, পরিবর্তন বা অনুমোদন করতে পারেন।
ধাপ ১: একটি প্ল্যানের জন্য অনুরোধ করুন
প্রথম ইন্টারঅ্যাকশনে collaborative_planning=True সেট করুন। এজেন্ট একটি সম্পূর্ণ রিপোর্টের পরিবর্তে একটি গবেষণা পরিকল্পনা ফেরত দেবে।
পাইথন
from google import genai
client = genai.Client()
# First interaction: request a research plan
plan_interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Do some research on Google TPUs.",
agent_config={
"type": "deep-research",
"thinking_summaries": "auto",
"collaborative_planning": True,
},
background=True,
)
# Wait for and retrieve the plan
while (result := client.interactions.get(id=plan_interaction.id)).status != "completed":
time.sleep(5)
print(result.outputs[-1].text)
জাভাস্ক্রিপ্ট
const planInteraction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Do some research on Google TPUs.',
agent_config: {
type: 'deep-research',
thinking_summaries: 'auto',
collaborative_planning: true
},
background: true
});
let result;
while ((result = await client.interactions.get(planInteraction.id)).status !== 'completed') {
await new Promise(r => setTimeout(r, 5000));
}
console.log(result.outputs[result.outputs.length - 1].text);
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Do some research on Google TPUs.",
"agent_config": {
"type": "deep-research",
"thinking_summaries": "auto",
"collaborative_planning": true
},
"background": true
}'
ধাপ ২: পরিকল্পনাটি পরিমার্জন করুন (ঐচ্ছিক)
কথোপকথন চালিয়ে যেতে এবং পরিকল্পনাটি পরিমার্জন করতে previous_interaction_id ব্যবহার করুন। পরিকল্পনা মোডে থাকতে collaborative_planning=True রাখুন।
পাইথন
# Second interaction: refine the plan
refined_plan = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Focus more on the differences between Google TPUs and competitor hardware, and less on the history.",
agent_config={
"type": "deep-research",
"thinking_summaries": "auto",
"collaborative_planning": True,
},
previous_interaction_id=plan_interaction.id,
background=True,
)
while (result := client.interactions.get(id=refined_plan.id)).status != "completed":
time.sleep(5)
print(result.outputs[-1].text)
জাভাস্ক্রিপ্ট
const refinedPlan = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Focus more on the differences between Google TPUs and competitor hardware, and less on the history.',
agent_config: {
type: 'deep-research',
thinking_summaries: 'auto',
collaborative_planning: true
},
previous_interaction_id: planInteraction.id,
background: true
});
let result;
while ((result = await client.interactions.get(refinedPlan.id)).status !== 'completed') {
await new Promise(r => setTimeout(r, 5000));
}
console.log(result.outputs[result.outputs.length - 1].text);
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Focus more on the differences between Google TPUs and competitor hardware, and less on the history.",
"agent_config": {
"type": "deep-research",
"thinking_summaries": "auto",
"collaborative_planning": true
},
"previous_interaction_id": "PREVIOUS_INTERACTION_ID",
"background": true
}'
ধাপ ৩: অনুমোদন ও কার্যকর করুন
পরিকল্পনাটি অনুমোদন করতে এবং গবেষণা শুরু করতে collaborative_planning=False সেট করুন (অথবা এটি বাদ দিন)।
পাইথন
# Third interaction: approve the plan and kick off research
final_report = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Plan looks good!",
agent_config={
"type": "deep-research",
"thinking_summaries": "auto",
"collaborative_planning": False,
},
previous_interaction_id=refined_plan.id,
background=True,
)
while (result := client.interactions.get(id=final_report.id)).status != "completed":
time.sleep(5)
print(result.outputs[-1].text)
জাভাস্ক্রিপ্ট
const finalReport = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Plan looks good!',
agent_config: {
type: 'deep-research',
thinking_summaries: 'auto',
collaborative_planning: false
},
previous_interaction_id: refinedPlan.id,
background: true
});
let result;
while ((result = await client.interactions.get(finalReport.id)).status !== 'completed') {
await new Promise(r => setTimeout(r, 5000));
}
console.log(result.outputs[result.outputs.length - 1].text);
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Plan looks good!",
"agent_config": {
"type": "deep-research",
"thinking_summaries": "auto",
"collaborative_planning": false
},
"previous_interaction_id": "PREVIOUS_INTERACTION_ID",
"background": true
}'
ভিজ্যুয়ালাইজেশন
যখন visualization "auto" তে সেট করা থাকে, তখন এজেন্ট তার গবেষণার ফলাফলকে সমর্থন করার জন্য চার্ট, গ্রাফ এবং অন্যান্য ভিজ্যুয়াল উপাদান তৈরি করতে পারে। তৈরি করা ছবিগুলো রেসপন্স আউটপুটে অন্তর্ভুক্ত থাকে এবং image ডেল্টা হিসেবে স্ট্রিম করা হয়। সেরা ফলাফলের জন্য, আপনার কোয়েরিতে স্পষ্টভাবে ভিজ্যুয়ালের জন্য অনুরোধ করুন — উদাহরণস্বরূপ, "সময়ের সাথে সাথে প্রবণতা দেখানো চার্ট অন্তর্ভুক্ত করুন" অথবা "মার্কেট শেয়ার তুলনা করে গ্রাফিক্স তৈরি করুন"। visualization "auto" তে সেট করলে এই সক্ষমতাটি চালু হয়, কিন্তু এজেন্ট শুধুমাত্র তখনই ভিজ্যুয়াল তৈরি করে যখন প্রম্পট তার জন্য অনুরোধ করে।
পাইথন
import base64
from IPython.display import Image, display
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Analyze global semiconductor market trends. Include graphics showing market share changes.",
agent_config={
"type": "deep-research",
"visualization": "auto",
},
background=True,
)
print(f"Research started: {interaction.id}")
while (result := client.interactions.get(id=interaction.id)).status != "completed":
time.sleep(5)
for output in result.outputs:
if output.type == "text":
print(output.text)
elif output.type == "image" and output.data:
image_bytes = base64.b64decode(output.data)
print(f"Received image: {len(image_bytes)} bytes")
# To display in a Jupyter notebook:
# from IPython.display import display, Image
# display(Image(data=image_bytes))
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from '@google/genai';
const client = new GoogleGenAI({});
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Analyze global semiconductor market trends. Include graphics showing market share changes.',
agent_config: {
type: 'deep-research',
visualization: 'auto'
},
background: true
});
console.log(`Research started: ${interaction.id}`);
let result;
while ((result = await client.interactions.get(interaction.id)).status !== 'completed') {
await new Promise(r => setTimeout(r, 5000));
}
for (const output of result.outputs) {
if (output.type === 'text') {
console.log(output.text);
} else if (output.type === 'image' && output.data) {
console.log(`[Image Output: ${output.data.substring(0, 20)}...]`);
}
}
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Analyze global semiconductor market trends. Include graphics showing market share changes.",
"agent_config": {
"type": "deep-research",
"visualization": "auto"
},
"background": true
}'
সমর্থিত সরঞ্জাম
ডিপ রিসার্চ একাধিক বিল্ট-ইন এবং এক্সটার্নাল টুল সমর্থন করে। ডিফল্টরূপে (যখন কোনো tools প্যারামিটার প্রদান করা হয় না), এজেন্ট গুগল সার্চ, ইউআরএল কনটেক্সট এবং কোড এক্সিকিউশন অ্যাক্সেস করতে পারে। আপনি এজেন্টের ক্ষমতা সীমিত বা প্রসারিত করতে সুস্পষ্টভাবে টুলস নির্দিষ্ট করে দিতে পারেন।
| সরঞ্জাম | টাইপ মান | বর্ণনা |
|---|---|---|
| গুগল অনুসন্ধান | google_search | পাবলিক ওয়েব অনুসন্ধান করুন। ডিফল্টরূপে সক্রিয়। |
| ইউআরএল প্রসঙ্গ | url_context | ওয়েব পেজের বিষয়বস্তু পড়ুন এবং সারসংক্ষেপ করুন। ডিফল্টরূপে সক্রিয় করা আছে। |
| কোড এক্সিকিউশন | code_execution | গণনা ও ডেটা বিশ্লেষণ করার জন্য কোড চালান। এটি ডিফল্টরূপে সক্রিয় থাকে। |
| এমসিপি সার্ভার | mcp_server | বাহ্যিক টুল ব্যবহারের জন্য রিমোট এমসিপি সার্ভারগুলোর সাথে সংযোগ করুন। |
| ফাইল অনুসন্ধান | file_search | আপনার আপলোড করা নথি সংকলন অনুসন্ধান করুন। |
গুগল অনুসন্ধান
একমাত্র টুল হিসেবে গুগল সার্চকে স্পষ্টভাবে সক্রিয় করুন:
পাইথন
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="What are the latest developments in quantum computing?",
tools=[{"type": "google_search"}],
background=True,
)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'What are the latest developments in quantum computing?',
tools: [{ type: 'google_search' }],
background: true
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "What are the latest developments in quantum computing?",
"tools": [{"type": "google_search"}],
"background": true
}'
ইউআরএল প্রসঙ্গ
এজেন্টকে নির্দিষ্ট ওয়েব পেজগুলো পড়ার এবং সারসংক্ষেপ করার ক্ষমতা দিন:
পাইথন
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Summarize the content of https://www.wikipedia.org/.",
tools=[{"type": "url_context"}],
background=True,
)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Summarize the content of https://www.wikipedia.org/.',
tools: [{ type: 'url_context' }],
background: true
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Summarize the content of https://www.wikipedia.org/.",
"tools": [{"type": "url_context"}],
"background": true
}'
কোড এক্সিকিউশন
এজেন্টকে গণনা এবং ডেটা বিশ্লেষণের জন্য কোড কার্যকর করার অনুমতি দিন:
পাইথন
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Calculate the 50th Fibonacci number.",
tools=[{"type": "code_execution"}],
background=True,
)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Calculate the 50th Fibonacci number.',
tools: [{ type: 'code_execution' }],
background: true
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Calculate the 50th Fibonacci number.",
"tools": [{"type": "code_execution"}],
"background": true
}'
এমসিপি সার্ভার
টুলস কনফিগারেশনে সার্ভারের name এবং url প্রদান করুন। এছাড়াও আপনি অথেনটিকেশন ক্রেডেনশিয়াল দিতে পারেন এবং এজেন্ট কোন কোন টুল কল করতে পারবে তা সীমাবদ্ধ করতে পারেন।
| মাঠ | প্রকার | প্রয়োজনীয় | বর্ণনা |
|---|---|---|---|
type | string | হ্যাঁ | অবশ্যই "mcp_server" হতে হবে। |
name | string | না | এমসিপি সার্ভারের জন্য একটি প্রদর্শিত নাম। |
url | string | না | এমসিপি সার্ভার এন্ডপয়েন্টের সম্পূর্ণ ইউআরএল। |
headers | object | না | সার্ভারে প্রতিটি অনুরোধের সাথে HTTP হেডার হিসেবে পাঠানো কী-ভ্যালু পেয়ার (উদাহরণস্বরূপ, অথেনটিকেশন টোকেন)। |
allowed_tools | array | না | এজেন্ট সার্ভার থেকে কোন কোন টুল কল করতে পারবে তা সীমাবদ্ধ করুন। |
মৌলিক ব্যবহার
পাইথন
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Check the status of my last server deployment.",
tools=[
{
"type": "mcp_server",
"name": "Deployment Tracker",
"url": "https://mcp.example.com/mcp",
"headers": {"Authorization": "Bearer my-token"},
}
],
background=True,
)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Check the status of my last server deployment.',
tools: [
{
type: 'mcp_server',
name: 'Deployment Tracker',
url: 'https://mcp.example.com/mcp',
headers: { Authorization: 'Bearer my-token' }
}
],
background: true
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": "Check the status of my last server deployment.",
"tools": [
{
"type": "mcp_server",
"name": "Deployment Tracker",
"url": "https://mcp.example.com/mcp",
"headers": {"Authorization": "Bearer my-token"}
}
],
"background": true
}'
ফাইল অনুসন্ধান
ফাইল সার্চ টুল ব্যবহার করে এজেন্টকে আপনার নিজের ডেটাতে অ্যাক্সেস দিন।
পাইথন
import time
from google import genai
client = genai.Client()
interaction = client.interactions.create(
input="Compare our 2025 fiscal year report against current public web news.",
agent="deep-research-preview-04-2026",
background=True,
tools=[
{
"type": "file_search",
"file_search_store_names": ['fileSearchStores/my-store-name']
}
]
)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
input: 'Compare our 2025 fiscal year report against current public web news.',
agent: 'deep-research-preview-04-2026',
background: true,
tools: [
{ type: 'file_search', file_search_store_names: ['fileSearchStores/my-store-name'] },
]
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": "Compare our 2025 fiscal year report against current public web news.",
"agent": "deep-research-preview-04-2026",
"background": true,
"tools": [
{"type": "file_search", "file_search_store_names": ["fileSearchStores/my-store-name"]},
]
}'
পরিচালনাযোগ্যতা এবং বিন্যাস
আপনার প্রম্পটে নির্দিষ্ট ফরম্যাটিং নির্দেশনা প্রদান করে আপনি এজেন্টের আউটপুটকে নিয়ন্ত্রণ করতে পারেন। এর মাধ্যমে আপনি রিপোর্টকে নির্দিষ্ট বিভাগ ও উপবিভাগে বিন্যস্ত করতে, ডেটা টেবিল অন্তর্ভুক্ত করতে, অথবা বিভিন্ন পাঠকের জন্য এর সুর (যেমন, "প্রযুক্তিগত," "নির্বাহী," "সাধারণ") সামঞ্জস্য করতে পারেন।
আপনার ইনপুট টেক্সটে কাঙ্ক্ষিত আউটপুট ফরম্যাটটি স্পষ্টভাবে উল্লেখ করুন।
পাইথন
prompt = """
Research the competitive landscape of EV batteries.
Format the output as a technical report with the following structure:
1. Executive Summary
2. Key Players (Must include a data table comparing capacity and chemistry)
3. Supply Chain Risks
"""
interaction = client.interactions.create(
input=prompt,
agent="deep-research-preview-04-2026",
background=True
)
জাভাস্ক্রিপ্ট
const prompt = `
Research the competitive landscape of EV batteries.
Format the output as a technical report with the following structure:
1. Executive Summary
2. Key Players (Must include a data table comparing capacity and chemistry)
3. Supply Chain Risks
`;
const interaction = await client.interactions.create({
input: prompt,
agent: 'deep-research-preview-04-2026',
background: true,
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": "Research the competitive landscape of EV batteries.\n\nFormat the output as a technical report with the following structure: \n1. Executive Summary\n2. Key Players (Must include a data table comparing capacity and chemistry)\n3. Supply Chain Risks",
"agent": "deep-research-preview-04-2026",
"background": true
}'
মাল্টিমোডাল ইনপুট
ডিপ রিসার্চ ছবি এবং ডকুমেন্ট (পিডিএফ)-সহ মাল্টিমোডাল ইনপুট সমর্থন করে, যা এজেন্টকে ভিজ্যুয়াল কন্টেন্ট বিশ্লেষণ করতে এবং প্রদত্ত ইনপুটের প্রেক্ষাপটে ওয়েব-ভিত্তিক গবেষণা পরিচালনা করতে সক্ষম করে।
পাইথন
import time
from google import genai
client = genai.Client()
prompt = """Analyze the interspecies dynamics and behavioral risks present
in the provided image of the African watering hole. Specifically, investigate
the symbiotic relationship between the avian species and the pachyderms
shown, and conduct a risk assessment for the reticulated giraffes based on
their drinking posture relative to the specific predator visible in the
foreground."""
interaction = client.interactions.create(
input=[
{"type": "text", "text": prompt},
{
"type": "image",
"uri": "https://storage.googleapis.com/generativeai-downloads/images/generated_elephants_giraffes_zebras_sunset.jpg"
}
],
agent="deep-research-preview-04-2026",
background=True
)
print(f"Research started: {interaction.id}")
while True:
interaction = client.interactions.get(interaction.id)
if interaction.status == "completed":
print(interaction.outputs[-1].text)
break
elif interaction.status == "failed":
print(f"Research failed: {interaction.error}")
break
time.sleep(10)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from '@google/genai';
const client = new GoogleGenAI({});
const prompt = `Analyze the interspecies dynamics and behavioral risks present
in the provided image of the African watering hole. Specifically, investigate
the symbiotic relationship between the avian species and the pachyderms
shown, and conduct a risk assessment for the reticulated giraffes based on
their drinking posture relative to the specific predator visible in the
foreground.`;
const interaction = await client.interactions.create({
input: [
{ type: 'text', text: prompt },
{
type: 'image',
uri: 'https://storage.googleapis.com/generativeai-downloads/images/generated_elephants_giraffes_zebras_sunset.jpg'
}
],
agent: 'deep-research-preview-04-2026',
background: true
});
console.log(`Research started: ${interaction.id}`);
while (true) {
const result = await client.interactions.get(interaction.id);
if (result.status === 'completed') {
console.log(result.outputs[result.outputs.length - 1].text);
break;
} else if (result.status === 'failed') {
console.log(`Research failed: ${result.error}`);
break;
}
await new Promise(resolve => setTimeout(resolve, 10000));
}
বিশ্রাম
# 1. Start the research task with image input
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": [
{"type": "text", "text": "Analyze the interspecies dynamics and behavioral risks present in the provided image of the African watering hole. Specifically, investigate the symbiotic relationship between the avian species and the pachyderms shown, and conduct a risk assessment for the reticulated giraffes based on their drinking posture relative to the specific predator visible in the foreground."},
{"type": "image", "uri": "https://storage.googleapis.com/generativeai-downloads/images/generated_elephants_giraffes_zebras_sunset.jpg"}
],
"agent": "deep-research-preview-04-2026",
"background": true
}'
# 2. Poll for results (Replace INTERACTION_ID)
# curl -X GET "https://generativelanguage.googleapis.com/v1beta/interactions/INTERACTION_ID" \
# -H "x-goog-api-key: $GEMINI_API_KEY"
নথি বোঝা
নথিগুলো সরাসরি মাল্টিমোডাল ইনপুট হিসেবে প্রেরণ করুন। এজেন্ট প্রদত্ত নথিগুলো বিশ্লেষণ করে এবং সেগুলোর বিষয়বস্তুর ওপর ভিত্তি করে গবেষণা পরিচালনা করে।
পাইথন
from google import genai
client = genai.Client()
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input=[
{"type": "text", "text": "What is this document about?"},
{
"type": "document",
"uri": "https://arxiv.org/pdf/1706.03762",
"mime_type": "application/pdf",
},
],
background=True,
)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from '@google/genai';
const client = new GoogleGenAI({});
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: [
{ type: 'text', text: 'What is this document about?' },
{
type: 'document',
uri: 'https://arxiv.org/pdf/1706.03762',
mime_type: 'application/pdf'
}
],
background: true
});
বিশ্রাম
# 1. Start the research task with document input
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"agent": "deep-research-preview-04-2026",
"input": [
{"type": "text", "text": "What is this document about?"},
{"type": "document", "uri": "https://arxiv.org/pdf/1706.03762", "mime_type": "application/pdf"}
],
"background": true
}'
দীর্ঘস্থায়ী কাজ পরিচালনা করা
গভীর গবেষণা একটি বহু-ধাপের প্রক্রিয়া, যার মধ্যে পরিকল্পনা, অনুসন্ধান, পঠন এবং লিখন অন্তর্ভুক্ত। এই চক্রটি সাধারণত সিনক্রোনাস এপিআই কলের সাধারণ টাইমআউট সীমা অতিক্রম করে।
এজেন্টদের background=True ব্যবহার করতে হবে। এপিআইটি তাৎক্ষণিকভাবে একটি আংশিক Interaction অবজেক্ট ফেরত দেয়। পোলিং-এর জন্য কোনো ইন্টারঅ্যাকশন খুঁজে পেতে আপনি id প্রপার্টিটি ব্যবহার করতে পারেন। ইন্টারঅ্যাকশনের অবস্থা in_progress থেকে completed বা failed এ পরিবর্তিত হবে।
স্ট্রিমিং
ডিপ রিসার্চ গবেষণার অগ্রগতির রিয়েল-টাইম আপডেট, যেমন—চিন্তার সারাংশ, টেক্সট আউটপুট এবং তৈরি করা ছবি, পাওয়ার জন্য স্ট্রিমিং সমর্থন করে। আপনাকে অবশ্যই stream=True এবং background=True সেট করতে হবে।
মধ্যবর্তী যুক্তির ধাপ (চিন্তাভাবনা) এবং অগ্রগতির আপডেট পেতে, আপনাকে agent_config এ thinking_summaries "auto" তে সেট করে থিংকিং সামারি সক্রিয় করতে হবে। এটি ছাড়া, স্ট্রিমটি শুধুমাত্র চূড়ান্ত ফলাফল প্রদান করতে পারে।
স্ট্রিম ইভেন্টের প্রকারভেদ
| ইভেন্টের ধরণ | ডেল্টা টাইপ | বর্ণনা |
|---|---|---|
content.delta | thought_summary | এজেন্টের পক্ষ থেকে যুক্তির মধ্যবর্তী ধাপ। |
content.delta | text | চূড়ান্ত পাঠ্য আউটপুটের একটি অংশ। |
content.delta | image | একটি তৈরি করা ছবি (বেস৬৪-এনকোডেড)। |
নিম্নলিখিত উদাহরণটি একটি গবেষণা টাস্ক শুরু করে এবং স্বয়ংক্রিয় পুনঃসংযোগের মাধ্যমে স্ট্রিমটি প্রসেস করে। এটি interaction_id এবং last_event_id ট্র্যাক করে, যাতে সংযোগ বিচ্ছিন্ন হয়ে গেলে (উদাহরণস্বরূপ, ৬০০-সেকেন্ডের টাইমআউটের পরে), এটি যেখান থেকে থেমেছিল সেখান থেকে আবার শুরু করতে পারে।
পাইথন
from google import genai
client = genai.Client()
interaction_id = None
last_event_id = None
is_complete = False
def process_stream(stream):
global interaction_id, last_event_id, is_complete
for chunk in stream:
if chunk.event_type == "interaction.start":
interaction_id = chunk.interaction.id
if chunk.event_id:
last_event_id = chunk.event_id
if chunk.event_type == "content.delta":
if chunk.delta.type == "text":
print(chunk.delta.text, end="", flush=True)
elif chunk.delta.type == "thought_summary":
print(f"Thought: {chunk.delta.content.text}", flush=True)
elif chunk.event_type in ("interaction.complete", "error"):
is_complete = True
stream = client.interactions.create(
input="Research the history of Google TPUs.",
agent="deep-research-preview-04-2026",
background=True,
stream=True,
agent_config={"type": "deep-research", "thinking_summaries": "auto"},
)
process_stream(stream)
# Reconnect if the connection drops
while not is_complete and interaction_id:
status = client.interactions.get(interaction_id)
if status.status != "in_progress":
break
stream = client.interactions.get(
id=interaction_id, stream=True, last_event_id=last_event_id,
)
process_stream(stream)
জাভাস্ক্রিপ্ট
import { GoogleGenAI } from '@google/genai';
const client = new GoogleGenAI({});
let interactionId;
let lastEventId;
let isComplete = false;
async function processStream(stream) {
for await (const chunk of stream) {
if (chunk.event_type === 'interaction.start') {
interactionId = chunk.interaction.id;
}
if (chunk.event_id) lastEventId = chunk.event_id;
if (chunk.event_type === 'content.delta') {
if (chunk.delta.type === 'text') {
process.stdout.write(chunk.delta.text);
} else if (chunk.delta.type === 'thought_summary') {
console.log(`Thought: ${chunk.delta.content.text}`);
}
} else if (['interaction.complete', 'error'].includes(chunk.event_type)) {
isComplete = true;
}
}
}
const stream = await client.interactions.create({
input: 'Research the history of Google TPUs.',
agent: 'deep-research-preview-04-2026',
background: true,
stream: true,
agent_config: { type: 'deep-research', thinking_summaries: 'auto' },
});
await processStream(stream);
// Reconnect if the connection drops
while (!isComplete && interactionId) {
const status = await client.interactions.get(interactionId);
if (status.status !== 'in_progress') break;
const resumeStream = await client.interactions.get(interactionId, {
stream: true, last_event_id: lastEventId,
});
await processStream(resumeStream);
}
বিশ্রাম
# 1. Start the stream (save the INTERACTION_ID from the interaction.start event
# and the last "event_id" you receive)
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": "Research the history of Google TPUs.",
"agent": "deep-research-preview-04-2026",
"background": true,
"stream": true,
"agent_config": {
"type": "deep-research",
"thinking_summaries": "auto"
}
}'
# 2. If the connection drops, reconnect with your saved IDs
curl -X GET "https://generativelanguage.googleapis.com/v1beta/interactions/INTERACTION_ID?stream=true&last_event_id=LAST_EVENT_ID" \
-H "x-goog-api-key: $GEMINI_API_KEY"
পরবর্তী প্রশ্ন এবং আলাপচারিতা
এজেন্ট চূড়ান্ত প্রতিবেদনটি ফেরত দেওয়ার পর আপনি previous_interaction_id ব্যবহার করে কথোপকথনটি চালিয়ে যেতে পারেন। এর মাধ্যমে আপনি সম্পূর্ণ কাজটি পুনরায় শুরু না করেই গবেষণার নির্দিষ্ট অংশ সম্পর্কে স্পষ্টীকরণ, সারসংক্ষেপ বা বিশদ ব্যাখ্যা চাইতে পারেন।
পাইথন
import time
from google import genai
client = genai.Client()
interaction = client.interactions.create(
input="Can you elaborate on the second point in the report?",
model="gemini-3.1-pro-preview",
previous_interaction_id="COMPLETED_INTERACTION_ID"
)
print(interaction.outputs[-1].text)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
input: 'Can you elaborate on the second point in the report?',
model: 'gemini-3.1-pro-preview',
previous_interaction_id: 'COMPLETED_INTERACTION_ID'
});
console.log(interaction.outputs[interaction.outputs.length - 1].text);
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": "Can you elaborate on the second point in the report?",
"model": "gemini-3.1-pro-preview",
"previous_interaction_id": "COMPLETED_INTERACTION_ID"
}'
কখন জেমিনি ডিপ রিসার্চ এজেন্ট ব্যবহার করবেন
ডিপ রিসার্চ শুধু একটি মডেল নয়, এটি একটি এজেন্ট । এটি লো-ল্যাটেন্সি চ্যাটের পরিবর্তে এমন ওয়ার্কলোডের জন্য সবচেয়ে উপযুক্ত, যেখানে 'অ্যানালিস্ট-ইন-এ-বক্স' পদ্ধতির প্রয়োজন হয়।
| বৈশিষ্ট্য | স্ট্যান্ডার্ড জেমিনি মডেল | জেমিনি ডিপ রিসার্চ এজেন্ট |
|---|---|---|
| লেটেন্সি | সেকেন্ড | মিনিট (অ্যাসিঙ্ক/ব্যাকগ্রাউন্ড) |
| প্রক্রিয়া | তৈরি করুন -> আউটপুট | পরিকল্পনা -> অনুসন্ধান -> পঠন -> পুনরাবৃত্তি -> আউটপুট |
| আউটপুট | কথোপকথনের পাঠ্য, কোড, সংক্ষিপ্ত সারাংশ | বিস্তারিত প্রতিবেদন, বিশদ বিশ্লেষণ, তুলনামূলক সারণী |
| সেরা | চ্যাটবট, নিষ্কাশন, সৃজনশীল লেখা | বাজার বিশ্লেষণ, যথাযথ যাচাই, সাহিত্য পর্যালোচনা, প্রতিযোগিতামূলক রূপরেখা |
এজেন্ট কনফিগারেশন
Deep Research আচরণ নিয়ন্ত্রণের জন্য agent_config প্যারামিটারটি ব্যবহার করে। এটিকে নিম্নলিখিত ফিল্ডগুলোসহ একটি ডিকশনারি হিসেবে পাস করুন:
| মাঠ | প্রকার | ডিফল্ট | বর্ণনা |
|---|---|---|---|
type | string | প্রয়োজনীয় | অবশ্যই "deep-research" হতে হবে। |
thinking_summaries | string | "none" | স্ট্রিমিং চলাকালীন মধ্যবর্তী যুক্তির ধাপগুলো পেতে "auto" তে সেট করুন। এটি নিষ্ক্রিয় করতে "none" এ সেট করুন। |
visualization | string | "auto" | এজেন্ট-নির্মিত চার্ট ও ছবি চালু করতে "auto" তে সেট করুন। বন্ধ করতে "off" এ সেট করুন। |
collaborative_planning | boolean | false | গবেষণা শুরু হওয়ার আগে একাধিক ধাপে পরিকল্পনা পর্যালোচনা চালু করতে এটিকে ' true সেট করুন। |
পাইথন
agent_config = {
"type": "deep-research",
"thinking_summaries": "auto",
"visualization": "auto",
"collaborative_planning": False,
}
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Research the competitive landscape of cloud GPUs.",
agent_config=agent_config,
background=True,
)
জাভাস্ক্রিপ্ট
const interaction = await client.interactions.create({
agent: 'deep-research-preview-04-2026',
input: 'Research the competitive landscape of cloud GPUs.',
agent_config: {
type: 'deep-research',
thinking_summaries: 'auto',
visualization: 'auto',
collaborative_planning: false,
},
background: true,
});
বিশ্রাম
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-d '{
"input": "Research the competitive landscape of cloud GPUs.",
"agent": "deep-research-preview-04-2026",
"agent_config": {
"type": "deep-research",
"thinking_summaries": "auto",
"visualization": "auto",
"collaborative_planning": false
},
"background": true
}'
প্রাপ্যতা এবং মূল্য
আপনি Google AI Studio-এর Interactions API এবং Gemini API ব্যবহার করে Gemini Deep Research Agent-কে অ্যাক্সেস করতে পারেন।
মূল্য নির্ধারণ পদ্ধতিটি জেমিনি মডেল এবং এজেন্ট কর্তৃক ব্যবহৃত নির্দিষ্ট টুলগুলোর উপর ভিত্তি করে ' পে-অ্যাজ-ইউ-গো' মডেল অনুসরণ করে। সাধারণ চ্যাট অনুরোধের মতো নয়, যেখানে একটি অনুরোধের ফলে একটি মাত্র আউটপুট পাওয়া যায়, একটি ডিপ রিসার্চ টাস্ক হলো একটি এজেন্টিক ওয়ার্কফ্লো। একটিমাত্র অনুরোধ পরিকল্পনা, অনুসন্ধান, পঠন এবং যুক্তির একটি স্বয়ংক্রিয় চক্রকে সক্রিয় করে তোলে।
আনুমানিক খরচ
প্রয়োজনীয় গবেষণার গভীরতার উপর ভিত্তি করে খরচ ভিন্ন হয়। আপনার প্রশ্নের উত্তর দেওয়ার জন্য কতটা পড়া ও খোঁজাখুঁজি করা প্রয়োজন, তা এজেন্ট স্বতঃস্ফূর্তভাবে নির্ধারণ করে।
- গভীর গবেষণা (
deep-research-preview-04-2026): মাঝারি মানের বিশ্লেষণের প্রয়োজন এমন একটি সাধারণ কোয়েরির জন্য, এজেন্ট প্রায় ৮০টি সার্চ কোয়েরি, প্রায় ২.৫ লক্ষ ইনপুট টোকেন (যার মধ্যে প্রায় ৫০-৭০% ক্যাশ করা থাকে) এবং প্রায় ৬০ হাজার আউটপুট টোকেন ব্যবহার করতে পারে।- আনুমানিক মোট: প্রতি কাজে প্রায় ১.০০ – ৩.০০ ডলার
- ডিপ রিসার্চ ম্যাক্স (
deep-research-max-preview-04-2026): গভীর প্রতিযোগিতামূলক পরিস্থিতি বিশ্লেষণ বা ব্যাপক যাচাই-বাছাইয়ের জন্য, এজেন্টটি প্রায় ১৬০টি পর্যন্ত সার্চ কোয়েরি, প্রায় ৯ লক্ষ ইনপুট টোকেন (যার মধ্যে প্রায় ৫০-৭০% ক্যাশ করা থাকে) এবং প্রায় ৮০ হাজার আউটপুট টোকেন ব্যবহার করতে পারে।- আনুমানিক মোট: প্রতি কাজে প্রায় ৩.০০ – ৭.০০ ডলার
নিরাপত্তা সংক্রান্ত বিবেচনা
কোনো এজেন্টকে ওয়েব এবং আপনার ব্যক্তিগত ফাইলে প্রবেশাধিকার দেওয়ার ক্ষেত্রে নিরাপত্তাজনিত ঝুঁকিগুলো সতর্কতার সাথে বিবেচনা করা প্রয়োজন।
- ফাইল ব্যবহার করে প্রম্পট ইনজেকশন: এজেন্ট আপনার দেওয়া ফাইলগুলোর বিষয়বস্তু পড়ে। নিশ্চিত করুন যে আপলোড করা ডকুমেন্টগুলো (পিডিএফ, টেক্সট ফাইল) বিশ্বস্ত উৎস থেকে এসেছে। একটি ক্ষতিকারক ফাইলে এজেন্টের আউটপুটকে প্রভাবিত করার জন্য তৈরি করা লুকানো টেক্সট থাকতে পারে।
- ওয়েব কন্টেন্টের ঝুঁকি: এজেন্টটি পাবলিক ওয়েব অনুসন্ধান করে। যদিও আমরা শক্তিশালী সুরক্ষা ফিল্টার প্রয়োগ করি, তবুও এই ঝুঁকি থেকে যায় যে এজেন্টটি ক্ষতিকর ওয়েব পেজের সম্মুখীন হতে পারে এবং সেগুলোকে প্রসেস করতে পারে। আমরা উত্তরে প্রদত্ত
citationsপর্যালোচনা করে উৎসগুলো যাচাই করার পরামর্শ দিই। - তথ্য পাচার: এজেন্টকে সংবেদনশীল অভ্যন্তরীণ তথ্যের সারসংক্ষেপ করতে বলার সময় সতর্ক থাকুন, যদি আপনি তাকে ওয়েব ব্রাউজ করারও অনুমতি দেন।
সর্বোত্তম অনুশীলন
- অজানা তথ্যের জন্য নির্দেশ দিন: অনুপস্থিত ডেটা কীভাবে সামলাতে হবে, সে বিষয়ে এজেন্টকে নির্দেশনা দিন। উদাহরণস্বরূপ, আপনার নির্দেশে যোগ করুন, "যদি ২০২৫ সালের নির্দিষ্ট পরিসংখ্যান পাওয়া না যায়, তবে অনুমান না করে স্পষ্টভাবে বলুন যে সেগুলি প্রক্ষেপণ বা অনুপলব্ধ" ।
- প্রসঙ্গ প্রদান করুন: ইনপুট প্রম্পটে সরাসরি পটভূমি তথ্য বা সীমাবদ্ধতা উল্লেখ করে এজেন্টের গবেষণার ভিত্তি স্থাপন করুন।
- সহযোগিতামূলক পরিকল্পনা ব্যবহার করুন: জটিল অনুসন্ধানের ক্ষেত্রে, গবেষণা পরিকল্পনা কার্যকর করার আগে তা পর্যালোচনা ও পরিমার্জন করতে সহযোগিতামূলক পরিকল্পনা সক্রিয় করুন।
- মাল্টিমোডাল ইনপুট: ডিপ রিসার্চ এজেন্ট মাল্টিমোডাল ইনপুট সমর্থন করে। এটি সতর্কতার সাথে ব্যবহার করুন, কারণ এটি খরচ বাড়ায় এবং কনটেক্সট উইন্ডো ওভারফ্লো হওয়ার ঝুঁকি তৈরি করে।
সীমাবদ্ধতা
- বিটা স্ট্যাটাস : ইন্টারঅ্যাকশনস এপিআই পাবলিক বিটা পর্যায়ে রয়েছে। এর ফিচার ও স্কিমা পরিবর্তিত হতে পারে।
- কাস্টম টুলস: আপনি বর্তমানে কাস্টম ফাংশন কলিং টুলস সরবরাহ করতে পারবেন না, তবে ডিপ রিসার্চ এজেন্টের সাথে রিমোট এমসিপি (মডেল কনটেক্সট প্রোটোকল) সার্ভার ব্যবহার করতে পারেন।
- কাঠামোগত আউটপুট: ডিপ রিসার্চ এজেন্ট বর্তমানে কাঠামোগত আউটপুট সমর্থন করে না।
- সর্বোচ্চ গবেষণার সময়: ডিপ রিসার্চ এজেন্টের সর্বোচ্চ গবেষণার সময় ৬০ মিনিট। বেশিরভাগ কাজ ২০ মিনিটের মধ্যে সম্পন্ন হয়ে যাওয়ার কথা।
- স্টোরের প্রয়োজনীয়তা:
background=Trueব্যবহার করে এজেন্ট চালানোর জন্যstore=Trueপ্রয়োজন। - গুগল সার্চ: গুগল সার্চ ডিফল্টরূপে সক্রিয় থাকে এবং এর ফলাফলগুলোর ক্ষেত্রে নির্দিষ্ট বিধিনিষেধ প্রযোজ্য।
এরপর কী?
- ইন্টারঅ্যাকশন এপিআই সম্পর্কে আরও জানুন।
- জেমিনি এপিআই কুকবুক-এ গভীর গবেষণা চেষ্টা করে দেখুন।
- ফাইল সার্চ টুল ব্যবহার করে কীভাবে নিজের ডেটা ব্যবহার করতে হয় তা শিখুন।