Binjakët mendojnë
Modelet e serive Gemini 3 dhe 2.5 përdorin një "proces të të menduarit" të brendshëm që përmirëson ndjeshëm aftësitë e tyre të arsyetimit dhe planifikimit me shumë hapa, duke i bërë ato shumë efektive për detyra komplekse siç janë kodimi, matematika e avancuar dhe analiza e të dhënave.
Ky udhëzues ju tregon se si të punoni me aftësitë e të menduarit të Gemini duke përdorur Gemini API.
Gjeneroni përmbajtje duke menduar
Nisja e një kërkese me një model të të menduarit është e ngjashme me çdo kërkesë tjetër për gjenerimin e përmbajtjes. Dallimi kryesor qëndron në specifikimin e njërit prej modeleve me mbështetje të të menduarit në fushën e model :
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3-flash-preview",
input="Explain the concept of Occam's Razor and provide a simple, everyday example."
)
print(interaction.steps[-1].content[0].text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
const interaction = await client.interactions.create({
model: "gemini-3-flash-preview",
input: "Explain the concept of Occam's Razor and provide a simple, everyday example."
});
console.log(interaction.steps.at(-1).content[0].text);
PUSHTIM
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "gemini-3-flash-preview",
"input": "Explain the concept of Occam'\''s Razor and provide a simple example."
}'
Përmbledhje mendimesh
Përmbledhjet e mendimeve ofrojnë njohuri mbi procesin e brendshëm të arsyetimit të modelit. Si parazgjedhje, kthehet vetëm rezultati përfundimtar. Mund të aktivizoni përmbledhjet e mendimeve me thinking_summaries :
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3-flash-preview",
input="What is the sum of the first 50 prime numbers?",
generation_config={
"thinking_summaries": "auto"
}
)
for step in interaction.steps:
if step.type == "thought":
print("Thought summary:")
for content_block in step.summary:
if content_block.type == "text":
print(content_block.text)
print()
elif step.type == "model_output":
for content_block in step.content:
if content_block.type == "text":
print("Answer:")
print(content_block.text)
print()
JavaScript
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
const interaction = await client.interactions.create({
model: "gemini-3-flash-preview",
input: "What is the sum of the first 50 prime numbers?",
generationConfig: {
thinkingSummaries: "auto"
}
});
for (const step of interaction.steps) {
if (step.type === "thought") {
console.log("Thought summary:");
for (const contentBlock of step.summary) {
if (contentBlock.type === "text") console.log(contentBlock.text);
}
} else if (step.type === "model_output") {
for (const contentBlock of step.content) {
if (contentBlock.type === "text") {
console.log("Answer:");
console.log(contentBlock.text);
}
}
}
}
PUSHTIM
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "gemini-3-flash-preview",
"input": "What is the sum of the first 50 prime numbers?",
"generationConfig": {
"thinkingSummaries": "auto"
}
}'
Transmetoni duke menduar
Përdorni transmetimin për të marrë përmbledhje të mendimeve në rritje gjatë gjenerimit. Kjo kthen përmbledhje të vazhdueshme, në rritje, ndërsa ato gjenerohen:
Python
from google import genai
client = genai.Client()
prompt = """
Alice, Bob, and Carol each live in a different house on the same street: red, green, and blue.
Alice does not live in the red house.
Bob does not live in the green house.
Carol does not live in the red or green house.
Which house does each person live in?
"""
thoughts = ""
answer = ""
stream = client.interactions.create(
model="gemini-3-flash-preview",
input=prompt,
generation_config={
"thinking_summaries": "auto"
},
stream=True
)
thoughts = ""
answer = ""
for event in stream:
if event.event_type == "step.delta":
if event.delta.type == "thought":
if not thoughts:
print("Thinking...")
summary_text = getattr(event.delta, 'text', '')
print(f"[Thought] {summary_text}", end="")
thoughts += summary_text
elif event.delta.type == "text" and event.delta.text:
if not answer:
print("\nAnswer:")
print(event.delta.text, end="")
answer += event.delta.text
JavaScript
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
const prompt = `Alice, Bob, and Carol each live in a different house on the same
street: red, green, and blue. Alice does not live in the red house.
Bob does not live in the green house.
Carol does not live in the red or green house.
Which house does each person live in?`;
let thoughts = "";
let answer = "";
const stream = await client.interactions.create({
model: "gemini-3-flash-preview",
input: prompt,
generationConfig: {
thinkingSummaries: "auto"
},
stream: true
});
for await (const event of stream) {
if (event.type === "step.delta") {
if (event.delta.type === "thought") {
if (!thoughts) console.log("Thinking...");
process.stdout.write(`[Thought] ${event.delta.text || ""}`);
thoughts += event.delta.text || "";
} else if (event.delta.type === "text" && event.delta.text) {
if (!answer) console.log("\nAnswer:");
process.stdout.write(event.delta.text);
answer += event.delta.text;
}
}
}
Kontrolloni të menduarit
Modelet Gemini angazhohen në të menduarit dinamik si parazgjedhje, duke rregulluar automatikisht sasinë e përpjekjes së arsyetimit bazuar në kompleksitetin e kërkesës. Megjithatë, ju mund ta kontrolloni këtë sjellje duke përdorur parametrat e konfigurimit.
Nivelet e të menduarit (Binjakët 3)
Parametri thinking_level , i rekomanduar për modelet Gemini 3 e lart, ju lejon të kontrolloni sjelljen e arsyetimit.
| Niveli i të menduarit | Gemini 3.1 Pro | Gemini 3 Pro ( I vjetruar ) | Binjakët 3 Blic | Përshkrimi |
|---|---|---|---|---|
minimal | Nuk mbështetet | Nuk mbështetet | Mbështetur | Përputhet me cilësimin "pa menduar" për shumicën e pyetjeve. Modeli mund të mendojë shumë minimalisht për detyra komplekse kodimi. Minimizon vonesën për aplikacionet e bisedave ose me rendiment të lartë. Vini re, minimal nuk garanton që të menduarit është i çaktivizuar. |
low | Mbështetur | Mbështetur | Mbështetur | Minimizon vonesën dhe koston. Më e mira për ndjekjen e udhëzimeve, bisedën ose aplikacionet me rendiment të lartë. |
medium | Mbështetur | Nuk mbështetet | Mbështetur | Të menduarit e ekuilibruar për shumicën e detyrave. |
high | Mbështetur (Parazgjedhur, Dinamik) | Mbështetur (Parazgjedhur, Dinamik) | Mbështetur (Parazgjedhur, Dinamik) | Maksimizon thellësinë e arsyetimit. Modelit mund t'i duhet shumë më tepër kohë për të arritur një shenjë të parë rezultati (jo-menduese), por rezultati do të arsyetohet më me kujdes. |
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3-flash-preview",
input="Provide a list of 3 famous physicists and their key contributions",
generation_config={
"thinking_level": "low"
}
)
print(interaction.steps[-1].content[0].text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
const interaction = await client.interactions.create({
model: "gemini-3-flash-preview",
input: "Provide a list of 3 famous physicists and their key contributions",
generationConfig: {
thinkingLevel: "low"
}
});
console.log(interaction.steps.at(-1).content[0].text);
PUSHTIM
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "gemini-3-flash-preview",
"input": "Provide a list of 3 famous physicists and their key contributions",
"generation_config": {
"thinking_level": "low"
}
}'
Nuk mund ta çaktivizosh të menduarit për Gemini 3 Pro. Gemini 3 Flash nuk e mbështet as të menduarit plotësisht jashtë funksionit, por cilësimi minimal do të thotë që modeli ka të ngjarë të mos mendojë (megjithëse potencialisht mundet).
Nënshkrimet e mendimit
API-ja Gemini është pa gjendje, kështu që modeli trajton çdo kërkesë API në mënyrë të pavarur dhe nuk ka qasje në kontekstin e mendimit nga kthesat e mëparshme në ndërveprimet me shumë kthesa.
Për të mundësuar ruajtjen e kontekstit të mendimit përgjatë ndërveprimeve me shumë kthesa, Gemini kthen nënshkrimet e mendimit, të cilat janë përfaqësime të koduara të procesit të brendshëm të mendimit të modelit.
- Modelet Gemini 2.5 kthejnë nënshkrime mendimi kur të menduarit është i aktivizuar dhe kërkesa përfshin thirrjen e funksionit , konkretisht deklarimet e funksionit .
- Modelet Gemini 3 mund të kthejnë nënshkrime mendimesh për të gjitha llojet e pjesëve . Ne ju rekomandojmë që gjithmonë t'i kaloni të gjitha nënshkrimet siç i keni marrë, por kjo është e detyrueshme për nënshkrimet e thirrjes së funksioneve. Lexoni faqen e Nënshkrimeve të Mendimeve për të mësuar më shumë.
- Nënshkrimet kthehen nga modeli brenda pjesëve të tjera në përgjigje, për shembull, gjatë thirrjes së funksionit ose pjesëve të tekstit. Kthejeni të gjithë përgjigjen me të gjitha pjesët përsëri te modeli në kthesat pasuese.
- Mos i bashkoni pjesët me nënshkrime së bashku.
- Mos e bashkoni një pjesë me një nënshkrim me një pjesë tjetër pa nënshkrim.
Çmimet
Kur aktivizohet funksioni i të menduarit, çmimi i përgjigjes është shuma e tokenëve të daljes dhe tokenëve të të menduarit. Mund të merrni numrin total të tokenëve të të menduarit të gjeneruar nga fusha total_thought_tokens .
Python
# ...
print("Thoughts tokens:", interaction.usage.total_thought_tokens)
print("Output tokens:", interaction.usage.total_output_tokens)
JavaScript
// ...
console.log(`Thoughts tokens: ${interaction.usage.totalThoughtTokens}`);
console.log(`Output tokens: ${interaction.usage.totalOutputTokens}`);
Modelet e të menduarit gjenerojnë mendime të plota për të përmirësuar cilësinë e përgjigjes përfundimtare dhe më pas nxjerrin përmbledhje për të dhënë një pasqyrë të procesit të të menduarit. Çmimi bazohet në tokenët e plotë të të menduarit që modeli duhet të gjenerojë, pavarësisht se vetëm përmbledhja del nga API.
Mund të mësoni më shumë rreth tokenave në udhëzuesin e numërimit të tokenave .
Praktikat më të mira
Ky seksion përfshin udhëzime për përdorimin efikas të modeleve të të menduarit.
Debug dhe drejtim
Rishikimi i arsyetimit : Kur nuk po merrni përgjigjen e pritur nga modelet e të menduarit, mund të jetë e dobishme të analizoni me kujdes përmbledhjet e mendimit të Gemini. Mund të shihni se si e ka ndarë detyrën dhe ka arritur në përfundimin e saj, dhe ta përdorni atë informacion për të korrigjuar drejt rezultateve të duhura.
Jepni udhëzime në arsyetim : Nëse shpresoni për një rezultat veçanërisht të gjatë, mund të dëshironi të jepni udhëzime në kërkesën tuaj për të kufizuar sasinë e të menduarit që përdor modeli. Kjo ju lejon të rezervoni më shumë nga rezultati i tokenit për përgjigjen tuaj.
Kompleksiteti i detyrës
- Detyra të lehta (Mund të mendosh keq): Për kërkesa të thjeshta ku nuk kërkohet arsyetim kompleks, nuk kërkohet të mendosh. Shembuj:
- "Ku u themelua DeepMind?"
- "A po kërkon ky email një takim apo thjesht po jep informacion?"
- Detyra mesatare (Parazgjedhur/Disa mendime): Shumë kërkesa të zakonshme përfitojnë nga një shkallë përpunimi hap pas hapi ose një kuptim më i thellë. Shembuj:
- Analogjoni fotosintezën dhe rritjen.
- Krahasoni dhe bëni dallimin midis makinave elektrike dhe makinave hibride.
- Detyra të vështira (Aftësi maksimale të të menduarit): Për sfida vërtet komplekse, ne rekomandojmë caktimin e një buxheti të lartë të të menduarit. Këto lloje detyrash kërkojnë që modeli të angazhojë të gjitha aftësitë e tij të arsyetimit dhe planifikimit. Shembuj:
- Zgjidhni problemin 1 në AIME 2025: Gjeni shumën e të gjitha bazave të numrave të plotë b > 9...
- Shkruani kod Python për një aplikacion web që vizualizon të dhënat e tregut të aksioneve në kohë reale, duke përfshirë vërtetimin e përdoruesit. Bëjeni sa më efikas të jetë e mundur.
Modelet e mbështetura
| Model | Mendimi i paracaktuar | Nivelet e Mbështetura |
|---|---|---|
| Gemini-3.1-pro-pamje paraprake | Ndezur (i lartë) | i ulët, mesatar, i lartë |
| Gemini-3-flash-pamje paraprake | Ndezur (i lartë) | minimal, i ulët, mesatar, i lartë |
| Gemini-3-Pro-Parashikim | Ndezur (i lartë) | i ulët, i lartë |
| gemini-2.5-pro | Aktiv | Buxheti: 128-32768 |
| binjakët-2.5-shpërthim | Aktiv | Buxheti: 0-24576 |
| gemini-2.5-flash-lite | Joaktiv | Buxheti: 0-24576 |
Modelet e të menduarit funksionojnë me të gjitha mjetet dhe aftësitë e Gemini-t. Kjo u lejon modeleve të bashkëveprojnë me sisteme të jashtme, të ekzekutojnë kod ose të qasen në informacion në kohë reale, duke i përfshirë rezultatet në arsyetimin e tyre.
Çfarë vjen më pas
- Gjenerimi i tekstit : Përgjigjet themelore me tekst
- Thirrja e funksionit : Lidhu me mjetet
- Nënshkrimet e mendimit : Menaxhoni nënshkrimet në shumë kthesa
- Udhëzuesi Gemini 3 : Karakteristikat specifike të modelit