Kërkimi i Thellë i Gemini tani është i disponueshëm në pamje paraprake me planifikim bashkëpunues, vizualizim, mbështetje MCP dhe më shumë.

Kjo faqe është përkthyer nga Cloud Translation API.

Binjakët mendojnë

Shënim : Ky version i faqes mbulon API-në e re të Ndërveprimeve , e cila është aktualisht në Beta.
Për shpërndarje të qëndrueshme prodhimi, ju rekomandojmë të vazhdoni të përdorni API-n generateContent . Mund të përdorni butonin e çaktivizimit në këtë faqe për të kaluar midis versioneve.

Modelet e serive Gemini 3 dhe 2.5 përdorin një "proces të të menduarit" të brendshëm që përmirëson ndjeshëm aftësitë e tyre të arsyetimit dhe planifikimit me shumë hapa, duke i bërë ato shumë efektive për detyra komplekse siç janë kodimi, matematika e avancuar dhe analiza e të dhënave.

Ky udhëzues ju tregon se si të punoni me aftësitë e të menduarit të Gemini duke përdorur Gemini API.

Gjeneroni përmbajtje duke menduar

Nisja e një kërkese me një model të të menduarit është e ngjashme me çdo kërkesë tjetër për gjenerimin e përmbajtjes. Dallimi kryesor qëndron në specifikimin e njërit prej modeleve me mbështetje të të menduarit në fushën e model :

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3-flash-preview",
    input="Explain the concept of Occam's Razor and provide a simple, everyday example."
)
print(interaction.steps[-1].content[0].text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    model: "gemini-3-flash-preview",
    input: "Explain the concept of Occam's Razor and provide a simple, everyday example."
});
console.log(interaction.steps.at(-1).content[0].text);

PUSHTIM

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "gemini-3-flash-preview",
    "input": "Explain the concept of Occam'\''s Razor and provide a simple example."
  }'

Përmbledhje mendimesh

Përmbledhjet e mendimeve ofrojnë njohuri mbi procesin e brendshëm të arsyetimit të modelit. Si parazgjedhje, kthehet vetëm rezultati përfundimtar. Mund të aktivizoni përmbledhjet e mendimeve me thinking_summaries :

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3-flash-preview",
    input="What is the sum of the first 50 prime numbers?",
    generation_config={
        "thinking_summaries": "auto"
    }
)

for step in interaction.steps:
    if step.type == "thought":
        print("Thought summary:")
        for content_block in step.summary:
            if content_block.type == "text":
                print(content_block.text)
        print()
    elif step.type == "model_output":
        for content_block in step.content:
            if content_block.type == "text":
                print("Answer:")
                print(content_block.text)
                print()

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    model: "gemini-3-flash-preview",
    input: "What is the sum of the first 50 prime numbers?",
    generationConfig: {
        thinkingSummaries: "auto"
    }
});

for (const step of interaction.steps) {
    if (step.type === "thought") {
        console.log("Thought summary:");
        for (const contentBlock of step.summary) {
            if (contentBlock.type === "text") console.log(contentBlock.text);
        }
    } else if (step.type === "model_output") {
        for (const contentBlock of step.content) {
            if (contentBlock.type === "text") {
                console.log("Answer:");
                console.log(contentBlock.text);
            }
        }
    }
}

PUSHTIM

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "gemini-3-flash-preview",
    "input": "What is the sum of the first 50 prime numbers?",
    "generationConfig": {
      "thinkingSummaries": "auto"
    }
  }'

Transmetoni duke menduar

Përdorni transmetimin për të marrë përmbledhje të mendimeve në rritje gjatë gjenerimit. Kjo kthen përmbledhje të vazhdueshme, në rritje, ndërsa ato gjenerohen:

Python

from google import genai

client = genai.Client()

prompt = """
Alice, Bob, and Carol each live in a different house on the same street: red, green, and blue.
Alice does not live in the red house.
Bob does not live in the green house.
Carol does not live in the red or green house.
Which house does each person live in?
"""

thoughts = ""
answer = ""

stream = client.interactions.create(
    model="gemini-3-flash-preview",
    input=prompt,
    generation_config={
        "thinking_summaries": "auto"
    },
    stream=True
)

thoughts = ""
answer = ""

for event in stream:
    if event.event_type == "step.delta":
        if event.delta.type == "thought":
            if not thoughts:
                print("Thinking...")
            summary_text = getattr(event.delta, 'text', '')
            print(f"[Thought] {summary_text}", end="")
            thoughts += summary_text
        elif event.delta.type == "text" and event.delta.text:
            if not answer:
                print("\nAnswer:")
            print(event.delta.text, end="")
            answer += event.delta.text

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const prompt = `Alice, Bob, and Carol each live in a different house on the same
street: red, green, and blue. Alice does not live in the red house.
Bob does not live in the green house.
Carol does not live in the red or green house.
Which house does each person live in?`;

let thoughts = "";
let answer = "";

const stream = await client.interactions.create({
    model: "gemini-3-flash-preview",
    input: prompt,
    generationConfig: {
        thinkingSummaries: "auto"
    },
    stream: true
});

for await (const event of stream) {
    if (event.type === "step.delta") {
        if (event.delta.type === "thought") {
            if (!thoughts) console.log("Thinking...");
            process.stdout.write(`[Thought] ${event.delta.text || ""}`);
            thoughts += event.delta.text || "";
        } else if (event.delta.type === "text" && event.delta.text) {
            if (!answer) console.log("\nAnswer:");
            process.stdout.write(event.delta.text);
            answer += event.delta.text;
        }
    }
}

Kontrolloni të menduarit

Modelet Gemini angazhohen në të menduarit dinamik si parazgjedhje, duke rregulluar automatikisht sasinë e përpjekjes së arsyetimit bazuar në kompleksitetin e kërkesës. Megjithatë, ju mund ta kontrolloni këtë sjellje duke përdorur parametrat e konfigurimit.

Nivelet e të menduarit (Binjakët 3)

Parametri thinking_level , i rekomanduar për modelet Gemini 3 e lart, ju lejon të kontrolloni sjelljen e arsyetimit.

Niveli i të menduarit	Gemini 3.1 Pro	Gemini 3 Pro ( I vjetruar )	Binjakët 3 Blic	Përshkrimi
`minimal`	Nuk mbështetet	Nuk mbështetet	Mbështetur	Përputhet me cilësimin "pa menduar" për shumicën e pyetjeve. Modeli mund të mendojë shumë minimalisht për detyra komplekse kodimi. Minimizon vonesën për aplikacionet e bisedave ose me rendiment të lartë. Vini re, `minimal` nuk garanton që të menduarit është i çaktivizuar.
`low`	Mbështetur	Mbështetur	Mbështetur	Minimizon vonesën dhe koston. Më e mira për ndjekjen e udhëzimeve, bisedën ose aplikacionet me rendiment të lartë.
`medium`	Mbështetur	Nuk mbështetet	Mbështetur	Të menduarit e ekuilibruar për shumicën e detyrave.
`high`	Mbështetur (Parazgjedhur, Dinamik)	Mbështetur (Parazgjedhur, Dinamik)	Mbështetur (Parazgjedhur, Dinamik)	Maksimizon thellësinë e arsyetimit. Modelit mund t'i duhet shumë më tepër kohë për të arritur një shenjë të parë rezultati (jo-menduese), por rezultati do të arsyetohet më me kujdes.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3-flash-preview",
    input="Provide a list of 3 famous physicists and their key contributions",
    generation_config={
        "thinking_level": "low"
    }
)
print(interaction.steps[-1].content[0].text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

const interaction = await client.interactions.create({
    model: "gemini-3-flash-preview",
    input: "Provide a list of 3 famous physicists and their key contributions",
    generationConfig: {
        thinkingLevel: "low"
    }
});
console.log(interaction.steps.at(-1).content[0].text);

PUSHTIM

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "gemini-3-flash-preview",
    "input": "Provide a list of 3 famous physicists and their key contributions",
    "generation_config": {
      "thinking_level": "low"
    }
  }'

Nuk mund ta çaktivizosh të menduarit për Gemini 3 Pro. Gemini 3 Flash nuk e mbështet as të menduarit plotësisht jashtë funksionit, por cilësimi minimal do të thotë që modeli ka të ngjarë të mos mendojë (megjithëse potencialisht mundet).

Nënshkrimet e mendimit

API-ja Gemini është pa gjendje, kështu që modeli trajton çdo kërkesë API në mënyrë të pavarur dhe nuk ka qasje në kontekstin e mendimit nga kthesat e mëparshme në ndërveprimet me shumë kthesa.

Për të mundësuar ruajtjen e kontekstit të mendimit përgjatë ndërveprimeve me shumë kthesa, Gemini kthen nënshkrimet e mendimit, të cilat janë përfaqësime të koduara të procesit të brendshëm të mendimit të modelit.

Modelet Gemini 2.5 kthejnë nënshkrime mendimi kur të menduarit është i aktivizuar dhe kërkesa përfshin thirrjen e funksionit , konkretisht deklarimet e funksionit .
Modelet Gemini 3 mund të kthejnë nënshkrime mendimesh për të gjitha llojet e pjesëve . Ne ju rekomandojmë që gjithmonë t'i kaloni të gjitha nënshkrimet siç i keni marrë, por kjo është e detyrueshme për nënshkrimet e thirrjes së funksioneve. Lexoni faqen e Nënshkrimeve të Mendimeve për të mësuar më shumë.
Nënshkrimet kthehen nga modeli brenda pjesëve të tjera në përgjigje, për shembull, gjatë thirrjes së funksionit ose pjesëve të tekstit. Kthejeni të gjithë përgjigjen me të gjitha pjesët përsëri te modeli në kthesat pasuese.
Mos i bashkoni pjesët me nënshkrime së bashku.
Mos e bashkoni një pjesë me një nënshkrim me një pjesë tjetër pa nënshkrim.

Çmimet

Kur aktivizohet funksioni i të menduarit, çmimi i përgjigjes është shuma e tokenëve të daljes dhe tokenëve të të menduarit. Mund të merrni numrin total të tokenëve të të menduarit të gjeneruar nga fusha total_thought_tokens .

Python

# ...
print("Thoughts tokens:", interaction.usage.total_thought_tokens)
print("Output tokens:", interaction.usage.total_output_tokens)

JavaScript

// ...
console.log(`Thoughts tokens: ${interaction.usage.totalThoughtTokens}`);
console.log(`Output tokens: ${interaction.usage.totalOutputTokens}`);

Modelet e të menduarit gjenerojnë mendime të plota për të përmirësuar cilësinë e përgjigjes përfundimtare dhe më pas nxjerrin përmbledhje për të dhënë një pasqyrë të procesit të të menduarit. Çmimi bazohet në tokenët e plotë të të menduarit që modeli duhet të gjenerojë, pavarësisht se vetëm përmbledhja del nga API.

Mund të mësoni më shumë rreth tokenave në udhëzuesin e numërimit të tokenave .

Praktikat më të mira

Ky seksion përfshin udhëzime për përdorimin efikas të modeleve të të menduarit.

Debug dhe drejtim

Rishikimi i arsyetimit : Kur nuk po merrni përgjigjen e pritur nga modelet e të menduarit, mund të jetë e dobishme të analizoni me kujdes përmbledhjet e mendimit të Gemini. Mund të shihni se si e ka ndarë detyrën dhe ka arritur në përfundimin e saj, dhe ta përdorni atë informacion për të korrigjuar drejt rezultateve të duhura.
Jepni udhëzime në arsyetim : Nëse shpresoni për një rezultat veçanërisht të gjatë, mund të dëshironi të jepni udhëzime në kërkesën tuaj për të kufizuar sasinë e të menduarit që përdor modeli. Kjo ju lejon të rezervoni më shumë nga rezultati i tokenit për përgjigjen tuaj.

Kompleksiteti i detyrës

Detyra të lehta (Mund të mendosh keq): Për kërkesa të thjeshta ku nuk kërkohet arsyetim kompleks, nuk kërkohet të mendosh. Shembuj:
- "Ku u themelua DeepMind?"
- "A po kërkon ky email një takim apo thjesht po jep informacion?"
Detyra mesatare (Parazgjedhur/Disa mendime): Shumë kërkesa të zakonshme përfitojnë nga një shkallë përpunimi hap pas hapi ose një kuptim më i thellë. Shembuj:
- Analogjoni fotosintezën dhe rritjen.
- Krahasoni dhe bëni dallimin midis makinave elektrike dhe makinave hibride.
Detyra të vështira (Aftësi maksimale të të menduarit): Për sfida vërtet komplekse, ne rekomandojmë caktimin e një buxheti të lartë të të menduarit. Këto lloje detyrash kërkojnë që modeli të angazhojë të gjitha aftësitë e tij të arsyetimit dhe planifikimit. Shembuj:
- Zgjidhni problemin 1 në AIME 2025: Gjeni shumën e të gjitha bazave të numrave të plotë b > 9...
- Shkruani kod Python për një aplikacion web që vizualizon të dhënat e tregut të aksioneve në kohë reale, duke përfshirë vërtetimin e përdoruesit. Bëjeni sa më efikas të jetë e mundur.

Modelet e mbështetura

Model	Mendimi i paracaktuar	Nivelet e Mbështetura
Gemini-3.1-pro-pamje paraprake	Ndezur (i lartë)	i ulët, mesatar, i lartë
Gemini-3-flash-pamje paraprake	Ndezur (i lartë)	minimal, i ulët, mesatar, i lartë
Gemini-3-Pro-Parashikim	Ndezur (i lartë)	i ulët, i lartë
gemini-2.5-pro	Aktiv	Buxheti: 128-32768
binjakët-2.5-shpërthim	Aktiv	Buxheti: 0-24576
gemini-2.5-flash-lite	Joaktiv	Buxheti: 0-24576

Modelet e të menduarit funksionojnë me të gjitha mjetet dhe aftësitë e Gemini-t. Kjo u lejon modeleve të bashkëveprojnë me sisteme të jashtme, të ekzekutojnë kod ose të qasen në informacion në kohë reale, duke i përfshirë rezultatet në arsyetimin e tyre.

Çfarë vjen më pas

Gjenerimi i tekstit : Përgjigjet themelore me tekst
Thirrja e funksionit : Lidhu me mjetet
Nënshkrimet e mendimit : Menaxhoni nënshkrimet në shumë kthesa
Udhëzuesi Gemini 3 : Karakteristikat specifike të modelit