জেমিনি এবং লামাইন্ডেক্সের গবেষণা এজেন্ট

LlamaIndex হল আপনার ডেটার সাথে সংযুক্ত LLM ব্যবহার করে জ্ঞান এজেন্ট তৈরির একটি কাঠামো। এই উদাহরণটি আপনাকে দেখায় কিভাবে একজন গবেষণা এজেন্টের জন্য একটি মাল্টি-এজেন্ট ওয়ার্কফ্লো তৈরি করতে হয়। LlamaIndex-এ, Workflows হল এজেন্ট এবং মাল্টি-এজেন্ট সিস্টেমের মূল উপাদান।

আপনার একটি Gemini API কী প্রয়োজন। যদি আপনার কাছে ইতিমধ্যেই একটি না থাকে, তাহলে আপনি Google AI Studio থেকে একটি পেতে পারেন। প্রথমে, সমস্ত প্রয়োজনীয় LlamaIndex লাইব্রেরি ইনস্টল করুন। LlamaIndex হুডের নীচে google-genai প্যাকেজ ব্যবহার করে।

pip install llama-index llama-index-utils-workflow llama-index-llms-google-genai llama-index-tools-google

LlamaIndex-এ Gemini সেট আপ করুন

যেকোনো LlamaIndex এজেন্টের ইঞ্জিন হল একটি LLM যা যুক্তি এবং টেক্সট প্রক্রিয়াকরণ পরিচালনা করে। এই উদাহরণে Gemini 3 Flash ব্যবহার করা হয়েছে। নিশ্চিত করুন যে আপনি আপনার API কীটিকে একটি পরিবেশ পরিবর্তনশীল হিসেবে সেট করেছেন

import os
from llama_index.llms.google_genai import GoogleGenAI

# Set your API key in the environment elsewhere, or with os.environ['GEMINI_API_KEY'] = '...'
assert 'GEMINI_API_KEY' in os.environ

llm = GoogleGenAI(model="gemini-3-flash-preview")

সরঞ্জাম তৈরি করুন

এজেন্টরা বাইরের জগতের সাথে যোগাযোগ করার জন্য টুল ব্যবহার করে, যেমন ওয়েব অনুসন্ধান করা বা তথ্য সংরক্ষণ করা। LlamaIndex-এর টুলগুলি নিয়মিত Python ফাংশন হতে পারে, অথবা পূর্বে বিদ্যমান ToolSpecs থেকে আমদানি করা যেতে পারে। Gemini-তে Google Search ব্যবহারের জন্য একটি অন্তর্নির্মিত টুল রয়েছে, যা এখানে ব্যবহৃত হয়।

from google.genai import types

google_search_tool = types.Tool(
    google_search=types.GoogleSearch()
)

llm_with_search = GoogleGenAI(
    model="gemini-3-flash-preview",
    generation_config=types.GenerateContentConfig(tools=[google_search_tool])
)

এখন LLM ইনস্ট্যান্সটি এমন একটি কোয়েরি দিয়ে পরীক্ষা করুন যার জন্য অনুসন্ধান প্রয়োজন। এই নির্দেশিকাটি একটি চলমান ইভেন্ট লুপ (যেমন python -m asyncio বা Google Colab) ধরে নেয়।

response = await llm_with_search.acomplete("What's the weather like today in Biarritz?")
print(response)

রিসার্চ এজেন্ট পাইথন ফাংশনগুলিকে টুল হিসেবে ব্যবহার করবে। এই কাজটি সম্পাদন করার জন্য আপনি অনেক উপায়ে একটি সিস্টেম তৈরি করতে পারেন। এই উদাহরণে, আপনি নিম্নলিখিতগুলি ব্যবহার করবেন:

  1. search_web প্রদত্ত বিষয়ে তথ্যের জন্য ওয়েবে অনুসন্ধান করার জন্য Google অনুসন্ধানের সাথে Gemini ব্যবহার করে।
  2. record_notes ওয়েবে পাওয়া গবেষণাগুলিকে রাজ্যে সংরক্ষণ করে যাতে অন্যান্য সরঞ্জামগুলি এটি ব্যবহার করতে পারে।
  3. write_report ResearchAgent দ্বারা প্রাপ্ত তথ্য ব্যবহার করে প্রতিবেদনটি লেখে।
  4. review_report প্রতিবেদনটি পর্যালোচনা করে এবং প্রতিক্রিয়া প্রদান করে।

Context ক্লাস এজেন্ট/টুলগুলির মধ্যে অবস্থা অতিক্রম করে এবং প্রতিটি এজেন্ট সিস্টেমের বর্তমান অবস্থা জানতে পারবে।

from llama_index.core.workflow import Context

async def search_web(ctx: Context, query: str) -> str:
    """Useful for searching the web about a specific query or topic"""
    response = await llm_with_search.acomplete(f"""Please research given this query or topic,
    and return the result\n<query_or_topic>{query}</query_or_topic>""")
    return response

async def record_notes(ctx: Context, notes: str, notes_title: str) -> str:
    """Useful for recording notes on a given topic."""
    current_state = await ctx.store.get("state")
    if "research_notes" not in current_state:
        current_state["research_notes"] = {}
    current_state["research_notes"][notes_title] = notes
    await ctx.store.set("state", current_state)
    return "Notes recorded."

async def write_report(ctx: Context, report_content: str) -> str:
    """Useful for writing a report on a given topic."""
    current_state = await ctx.store.get("state")
    current_state["report_content"] = report_content
    await ctx.store.set("state", current_state)
    return "Report written."

async def review_report(ctx: Context, review: str) -> str:
    """Useful for reviewing a report and providing feedback."""
    current_state = await ctx.store.get("state")
    current_state["review"] = review
    await ctx.store.set("state", current_state)
    return "Report reviewed."

একটি মাল্টি-এজেন্ট সহকারী তৈরি করুন

একটি মাল্টি-এজেন্ট সিস্টেম তৈরি করতে, আপনাকে এজেন্ট এবং তাদের মিথস্ক্রিয়া সংজ্ঞায়িত করতে হবে। আপনার সিস্টেমে তিনটি এজেন্ট থাকবে:

  1. একজন ResearchAgent প্রদত্ত বিষয়ের উপর তথ্যের জন্য ওয়েবে অনুসন্ধান করে।
  2. একজন WriteAgent ResearchAgent দ্বারা প্রাপ্ত তথ্য ব্যবহার করে প্রতিবেদনটি লেখেন।
  3. একজন ReviewAgent রিপোর্টটি পর্যালোচনা করে এবং প্রতিক্রিয়া প্রদান করে।

এই উদাহরণে AgentWorkflow ক্লাস ব্যবহার করে একটি মাল্টি-এজেন্ট সিস্টেম তৈরি করা হয়েছে যা এই এজেন্টগুলিকে ক্রমানুসারে কার্যকর করবে। প্রতিটি এজেন্ট একটি system_prompt নেয় যা এটিকে কী করা উচিত তা বলে এবং অন্যান্য এজেন্টদের সাথে কীভাবে কাজ করতে হবে তা পরামর্শ দেয়।

ঐচ্ছিকভাবে, আপনি আপনার মাল্টি-এজেন্ট সিস্টেমকে can_handoff_to ব্যবহার করে অন্য কোন এজেন্টের সাথে কথা বলতে পারবেন তা নির্দিষ্ট করে সাহায্য করতে পারেন (যদি না হয়, তাহলে এটি নিজে থেকেই এটি বের করার চেষ্টা করবে)।

from llama_index.core.agent.workflow import (
    AgentInput,
    AgentOutput,
    ToolCall,
    ToolCallResult,
    AgentStream,
)
from llama_index.core.agent.workflow import FunctionAgent, ReActAgent

research_agent = FunctionAgent(
    name="ResearchAgent",
    description="Useful for searching the web for information on a given topic and recording notes on the topic.",
    system_prompt=(
        "You are the ResearchAgent that can search the web for information on a given topic and record notes on the topic. "
        "Once notes are recorded and you are satisfied, you should hand off control to the WriteAgent to write a report on the topic."
    ),
    llm=llm,
    tools=[search_web, record_notes],
    can_handoff_to=["WriteAgent"],
)

write_agent = FunctionAgent(
    name="WriteAgent",
    description="Useful for writing a report on a given topic.",
    system_prompt=(
        "You are the WriteAgent that can write a report on a given topic. "
        "Your report should be in a markdown format. The content should be grounded in the research notes. "
        "Once the report is written, you should get feedback at least once from the ReviewAgent."
    ),
    llm=llm,
    tools=[write_report],
    can_handoff_to=["ReviewAgent", "ResearchAgent"],
)

review_agent = FunctionAgent(
    name="ReviewAgent",
    description="Useful for reviewing a report and providing feedback.",
    system_prompt=(
        "You are the ReviewAgent that can review a report and provide feedback. "
        "Your feedback should either approve the current report or request changes for the WriteAgent to implement."
    ),
    llm=llm,
    tools=[review_report],
    can_handoff_to=["ResearchAgent","WriteAgent"],
)

এজেন্টগুলি সংজ্ঞায়িত করা হয়েছে, এখন আপনি AgentWorkflow তৈরি করতে এবং এটি চালাতে পারেন।

from llama_index.core.agent.workflow import AgentWorkflow

agent_workflow = AgentWorkflow(
    agents=[research_agent, write_agent, review_agent],
    root_agent=research_agent.name,
    initial_state={
        "research_notes": {},
        "report_content": "Not written yet.",
        "review": "Review required.",
    },
)

ওয়ার্কফ্লো কার্যকর করার সময়, আপনি কনসোলে ইভেন্ট, টুল কল এবং আপডেট স্ট্রিম করতে পারবেন।

from llama_index.core.agent.workflow import (
    AgentInput,
    AgentOutput,
    ToolCall,
    ToolCallResult,
    AgentStream,
)

research_topic = """Write me a report on the history of the web.
Briefly describe the history of the world wide web, including
the development of the internet and the development of the web,
including 21st century developments"""

handler = agent_workflow.run(
    user_msg=research_topic
)

current_agent = None
current_tool_calls = ""
async for event in handler.stream_events():
    if (
        hasattr(event, "current_agent_name")
        and event.current_agent_name != current_agent
    ):
        current_agent = event.current_agent_name
        print(f"\n{'='*50}")
        print(f"🤖 Agent: {current_agent}")
        print(f"{'='*50}\n")
    elif isinstance(event, AgentOutput):
        if event.response.content:
            print("📤 Output:", event.response.content)
        if event.tool_calls:
            print(
                "🛠️  Planning to use tools:",
                [call.tool_name for call in event.tool_calls],
            )
    elif isinstance(event, ToolCallResult):
        print(f"🔧 Tool Result ({event.tool_name}):")
        print(f"  Arguments: {event.tool_kwargs}")
        print(f"  Output: {event.tool_output}")
    elif isinstance(event, ToolCall):
        print(f"🔨 Calling Tool: {event.tool_name}")
        print(f"  With arguments: {event.tool_kwargs}")

কর্মপ্রবাহ সম্পূর্ণ হওয়ার পরে, আপনি প্রতিবেদনের চূড়ান্ত আউটপুট প্রিন্ট করতে পারেন, সেইসাথে তৎকালীন পর্যালোচনা এজেন্টের কাছ থেকে চূড়ান্ত পর্যালোচনার অবস্থাও প্রিন্ট করতে পারেন।

state = await handler.ctx.store.get("state")
print("Report Content:\n", state["report_content"])
print("\n------------\nFinal Review:\n", state["review"])

কাস্টম ওয়ার্কফ্লো দিয়ে আরও এগিয়ে যান

মাল্টি-এজেন্ট সিস্টেম দিয়ে শুরু করার জন্য AgentWorkflow একটি দুর্দান্ত উপায়। কিন্তু যদি আপনার আরও নিয়ন্ত্রণের প্রয়োজন হয়? আপনি শুরু থেকেই একটি ওয়ার্কফ্লো তৈরি করতে পারেন। আপনার নিজস্ব ওয়ার্কফ্লো তৈরি করার কিছু কারণ এখানে দেওয়া হল:

  • প্রক্রিয়াটির উপর আরও নিয়ন্ত্রণ : আপনার এজেন্টরা কোন পথটি নেবেন তা আপনি ঠিক করতে পারেন। এর মধ্যে রয়েছে লুপ তৈরি করা, নির্দিষ্ট পয়েন্টে সিদ্ধান্ত নেওয়া, অথবা এজেন্টদের বিভিন্ন কাজে সমান্তরালভাবে কাজ করানো।
  • জটিল ডেটা ব্যবহার করুন : প্লেইন টেক্সটের বাইরে যান। কাস্টম ওয়ার্কফ্লো আপনাকে আপনার ইনপুট এবং আউটপুটের জন্য আরও স্ট্রাকচার্ড ডেটা, যেমন JSON অবজেক্ট বা কাস্টম ক্লাস ব্যবহার করতে দেয়।
  • বিভিন্ন মাধ্যমের সাথে কাজ করুন : এমন এজেন্ট তৈরি করুন যারা কেবল টেক্সটই নয়, ছবি, অডিও এবং ভিডিওও বুঝতে এবং প্রক্রিয়া করতে পারে।
  • আরও স্মার্ট পরিকল্পনা : আপনি এমন একটি কর্মপ্রবাহ ডিজাইন করতে পারেন যা এজেন্টদের কাজ শুরু করার আগে প্রথমে একটি বিস্তারিত পরিকল্পনা তৈরি করে। এটি এমন জটিল কাজের জন্য কার্যকর যেখানে একাধিক ধাপের প্রয়োজন হয়।
  • Enable self-correction : Create agents that can review their own work. If the output isn't good enough, the agent can try again, creating a loop of improvement until the result is perfect.

LlamaIndex Workflows সম্পর্কে আরও জানতে, LlamaIndex Workflows ডকুমেন্টেশন দেখুন।