مدلهای سری Gemini 2.5 از یک «فرایند تفکر» داخلی در طول تولید پاسخ استفاده میکنند. این فرآیند به بهبود قابلیت های استدلال آنها کمک می کند و به آنها کمک می کند تا از برنامه ریزی چند مرحله ای برای حل وظایف پیچیده استفاده کنند. این باعث می شود این مدل ها به ویژه در کدنویسی، ریاضیات پیشرفته، تجزیه و تحلیل داده ها و سایر کارهایی که نیاز به برنامه ریزی یا تفکر دارند، خوب باشند.
این راهنما به شما نشان می دهد که چگونه با استفاده از Gemini API با قابلیت های تفکر Gemini کار کنید.
از مدل های تفکر استفاده کنید
مدلهای دارای قابلیت تفکر در Google AI Studio و از طریق Gemini API در دسترس هستند. Thinking به طور پیشفرض در API و AI Studio روشن است، زیرا مدلهای سری 2.5 این قابلیت را دارند که به طور خودکار تصمیم بگیرند که چه زمانی و چه مقدار فکر کنند. برای اکثر موارد استفاده، ترک فکر کردن مفید است. اما اگر میخواهید فکر کردن را خاموش کنید، میتوانید با تنظیم پارامتر thinkingBudget
روی 0 این کار را انجام دهید.
یک درخواست اساسی ارسال کنید
پایتون
from google import genai
client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents=prompt
)
print(response.text)
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: prompt,
});
console.log(response.text);
}
main();
برو
// import packages here
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.Text())
}
استراحت
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
}
]
}
]
}'
```
بودجه را برای مدل های تفکر تنظیم کنید
پارامتر thinkingBudget
به مدل راهنمایی در مورد تعداد نشانههای تفکری میدهد که میتواند هنگام ایجاد یک پاسخ استفاده کند. تعداد بیشتری از نشانه ها معمولاً با تفکر دقیق تری همراه است که برای حل وظایف پیچیده تر مورد نیاز است. thinkingBudget
باید یک عدد صحیح در محدوده 0 تا 24576 باشد. تنظیم بودجه تفکر بر روی 0 تفکر را غیرفعال می کند.
بسته به درخواست، ممکن است مدل از بودجه توکن سرریز یا کمتر شود.
پایتون
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents="Explain the Occam's Razor concept and provide everyday examples of it",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_budget=1024)
),
)
print(response.text)
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: "Explain the Occam's Razor concept and provide everyday examples of it",
config: {
thinkingConfig: {
thinkingBudget: 1024,
},
},
});
console.log(response.text);
}
main();
استراحت
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
}
]
}
],
"generationConfig": {
"thinkingConfig": {
"thinkingBudget": 1024
}
}
}'
از ابزارهایی با مدل های تفکر استفاده کنید
شما می توانید استفاده خود از مدل های تفکر را با هر یک از ابزارها و قابلیت های Gemini ترکیب کنید تا اقداماتی فراتر از تولید متن انجام دهید. این به آنها اجازه می دهد تا با سیستم های خارجی تعامل داشته باشند، کد را اجرا کنند یا به اطلاعات بلادرنگ دسترسی داشته باشند و نتایج را در استدلال و پاسخ نهایی خود بگنجانند.
ابزار جستجو به مدل اجازه می دهد تا از موتورهای جستجوی خارجی پرس و جو کند تا اطلاعات به روز یا اطلاعات فراتر از داده های آموزشی خود را بیابد. این برای سوالاتی در مورد رویدادهای اخیر یا موضوعات بسیار خاص مفید است.
ابزار اجرای کد، مدل را قادر میسازد تا کد پایتون را برای انجام محاسبات، دستکاری دادهها یا حل مشکلاتی که به بهترین شکل الگوریتمی دارند، تولید و اجرا کند. مدل خروجی کد را دریافت می کند و می تواند از آن در پاسخ خود استفاده کند.
با خروجی ساختاریافته ، میتوانید Gemini را محدود کنید تا با JSON، یک فرمت خروجی ساختاریافته مناسب برای پردازش خودکار، پاسخ دهد. این به ویژه برای ادغام خروجی مدل در برنامه ها مفید است.
فراخوانی تابع، مدل تفکر را به ابزارهای خارجی و APIها متصل میکند، بنابراین میتواند درباره زمان فراخوانی تابع مناسب و چه پارامترهایی توضیح دهد.
بهترین شیوه ها
این بخش شامل راهنمایی هایی برای استفاده کارآمد از مدل های تفکر است. مثل همیشه، پیروی از راهنماییهای فوری و بهترین روشها بهترین نتایج را برای شما به ارمغان میآورد.
اشکال زدایی و فرمان
استدلال را مرور کنید : وقتی پاسخ مورد انتظار خود را از مدل های تفکر دریافت نمی کنید، می تواند به تحلیل دقیق فرآیند استدلال جمینی کمک کند. میتوانید ببینید که چگونه کار را شکست و به نتیجه رسید و از آن اطلاعات برای تصحیح نتایج درست استفاده کنید.
راهنمایی در استدلال ارائه دهید : اگر به یک خروجی طولانی امیدوار هستید، ممکن است بخواهید در اعلان خود راهنمایی کنید تا میزان تفکری که مدل استفاده میکند محدود شود. این به شما امکان می دهد مقدار بیشتری از خروجی رمز را برای پاسخ خود رزرو کنید.
پیچیدگی کار
- وظایف آسان (تفکر ممکن است خاموش باشد): برای درخواستهای ساده، استدلال پیچیده مانند بازیابی یا طبقهبندی ساده واقعیت مورد نیاز نیست، تفکر لازم نیست. مثالها عبارتند از:
- "دیپ مایند کجا تاسیس شد؟"
- "آیا این ایمیل درخواست یک جلسه است یا فقط ارائه اطلاعات؟"
- وظایف متوسط (پیشفرض/برخی تفکر): بسیاری از درخواستهای رایج از درجهای از پردازش گام به گام یا درک عمیقتر بهره میبرند. جمینی می تواند به طور انعطاف پذیر از قابلیت تفکر برای کارهایی مانند:
- فتوسنتز و بزرگ شدن را آنالوگ کنید.
- مقایسه و مقایسه خودروهای الکتریکی و خودروهای هیبریدی.
- وظایف سخت (حداکثر قابلیت تفکر): برای چالشهای واقعاً پیچیده، هوش مصنوعی باید تواناییهای استدلال و برنامهریزی کامل خود را درگیر کند، که اغلب شامل بسیاری از مراحل داخلی قبل از ارائه پاسخ است. مثالها عبارتند از:
- حل مسئله 1 در AIME 2025: مجموع همه پایه های اعداد صحیح b > 9 را پیدا کنید که 17 b مقسوم علیه 97 b است.
- کد پایتون را برای یک برنامه وب بنویسید که داده های بازار سهام را در زمان واقعی، از جمله احراز هویت کاربر، تجسم می کند. آن را تا حد امکان کارآمد کنید.
بعدش چی؟
- Gemini 2.5 Pro Preview را در Google AI Studio امتحان کنید.
- برای اطلاعات بیشتر در مورد پیش نمایش Gemini 2.5 Pro و Gemini Flash 2.0 Thinking، به صفحه مدل مراجعه کنید.
- نمونه های بیشتری را در کتاب آشپزی Thinking امتحان کنید.