تفکر جوزا

مدل‌های سری Gemini 2.5 از یک «فرایند تفکر» داخلی در طول تولید پاسخ استفاده می‌کنند. این فرآیند به بهبود قابلیت های استدلال آنها کمک می کند و به آنها کمک می کند تا از برنامه ریزی چند مرحله ای برای حل وظایف پیچیده استفاده کنند. این باعث می شود این مدل ها به ویژه در کدنویسی، ریاضیات پیشرفته، تجزیه و تحلیل داده ها و سایر کارهایی که نیاز به برنامه ریزی یا تفکر دارند، خوب باشند.

این راهنما به شما نشان می دهد که چگونه با استفاده از Gemini API با قابلیت های تفکر Gemini کار کنید.

از مدل های تفکر استفاده کنید

مدل‌های دارای قابلیت تفکر در Google AI Studio و از طریق Gemini API در دسترس هستند. Thinking به طور پیش‌فرض در API و AI Studio روشن است، زیرا مدل‌های سری 2.5 این قابلیت را دارند که به طور خودکار تصمیم بگیرند که چه زمانی و چه مقدار فکر کنند. برای اکثر موارد استفاده، ترک فکر کردن مفید است. اما اگر می‌خواهید فکر کردن را خاموش کنید، می‌توانید با تنظیم پارامتر thinkingBudget روی 0 این کار را انجام دهید.

یک درخواست اساسی ارسال کنید

پایتون

from google import genai

client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents=prompt
)

print(response.text)

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: prompt,
  });

  console.log(response.text);
}

main();

برو

// import packages here

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
  if err != nil {
    log.Fatal(err)
  }
  defer client.Close()

  model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
  resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
  if err != nil {
    log.Fatal(err)
  }
  fmt.Println(resp.Text())
}

استراحت

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
 -H 'Content-Type: application/json' \
 -X POST \
 -d '{
   "contents": [
     {
       "parts": [
         {
           "text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
         }
       ]
     }
   ]
 }'
 ```

بودجه را برای مدل های تفکر تنظیم کنید

پارامتر thinkingBudget به مدل راهنمایی در مورد تعداد نشانه‌های تفکری می‌دهد که می‌تواند هنگام ایجاد یک پاسخ استفاده کند. تعداد بیشتری از نشانه ها معمولاً با تفکر دقیق تری همراه است که برای حل وظایف پیچیده تر مورد نیاز است. thinkingBudget باید یک عدد صحیح در محدوده 0 تا 24576 باشد. تنظیم بودجه تفکر بر روی 0 تفکر را غیرفعال می کند.

بسته به درخواست، ممکن است مدل از بودجه توکن سرریز یا کمتر شود.

پایتون

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents="Explain the Occam's Razor concept and provide everyday examples of it",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_budget=1024)
    ),
)

print(response.text)

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: "Explain the Occam's Razor concept and provide everyday examples of it",
    config: {
      thinkingConfig: {
        thinkingBudget: 1024,
      },
    },
  });

  console.log(response.text);
}

main();

استراحت

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [
    {
      "parts": [
        {
          "text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
        }
      ]
    }
  ],
  "generationConfig": {
    "thinkingConfig": {
          "thinkingBudget": 1024
    }
  }
}'

از ابزارهایی با مدل های تفکر استفاده کنید

شما می توانید استفاده خود از مدل های تفکر را با هر یک از ابزارها و قابلیت های Gemini ترکیب کنید تا اقداماتی فراتر از تولید متن انجام دهید. این به آنها اجازه می دهد تا با سیستم های خارجی تعامل داشته باشند، کد را اجرا کنند یا به اطلاعات بلادرنگ دسترسی داشته باشند و نتایج را در استدلال و پاسخ نهایی خود بگنجانند.

  • ابزار جستجو به مدل اجازه می دهد تا از موتورهای جستجوی خارجی پرس و جو کند تا اطلاعات به روز یا اطلاعات فراتر از داده های آموزشی خود را بیابد. این برای سوالاتی در مورد رویدادهای اخیر یا موضوعات بسیار خاص مفید است.

  • ابزار اجرای کد، مدل را قادر می‌سازد تا کد پایتون را برای انجام محاسبات، دستکاری داده‌ها یا حل مشکلاتی که به بهترین شکل الگوریتمی دارند، تولید و اجرا کند. مدل خروجی کد را دریافت می کند و می تواند از آن در پاسخ خود استفاده کند.

  • با خروجی ساختاریافته ، می‌توانید Gemini را محدود کنید تا با JSON، یک فرمت خروجی ساختاریافته مناسب برای پردازش خودکار، پاسخ دهد. این به ویژه برای ادغام خروجی مدل در برنامه ها مفید است.

  • فراخوانی تابع، مدل تفکر را به ابزارهای خارجی و APIها متصل می‌کند، بنابراین می‌تواند درباره زمان فراخوانی تابع مناسب و چه پارامترهایی توضیح دهد.

بهترین شیوه ها

این بخش شامل راهنمایی هایی برای استفاده کارآمد از مدل های تفکر است. مثل همیشه، پیروی از راهنمایی‌های فوری و بهترین روش‌ها بهترین نتایج را برای شما به ارمغان می‌آورد.

اشکال زدایی و فرمان

  • استدلال را مرور کنید : وقتی پاسخ مورد انتظار خود را از مدل های تفکر دریافت نمی کنید، می تواند به تحلیل دقیق فرآیند استدلال جمینی کمک کند. می‌توانید ببینید که چگونه کار را شکست و به نتیجه رسید و از آن اطلاعات برای تصحیح نتایج درست استفاده کنید.

  • راهنمایی در استدلال ارائه دهید : اگر به یک خروجی طولانی امیدوار هستید، ممکن است بخواهید در اعلان خود راهنمایی کنید تا میزان تفکری که مدل استفاده می‌کند محدود شود. این به شما امکان می دهد مقدار بیشتری از خروجی رمز را برای پاسخ خود رزرو کنید.

پیچیدگی کار

  • وظایف آسان (تفکر ممکن است خاموش باشد): برای درخواست‌های ساده، استدلال پیچیده مانند بازیابی یا طبقه‌بندی ساده واقعیت مورد نیاز نیست، تفکر لازم نیست. مثالها عبارتند از:
    • "دیپ مایند کجا تاسیس شد؟"
    • "آیا این ایمیل درخواست یک جلسه است یا فقط ارائه اطلاعات؟"
  • وظایف متوسط ​​(پیش‌فرض/برخی تفکر): بسیاری از درخواست‌های رایج از درجه‌ای از پردازش گام به گام یا درک عمیق‌تر بهره می‌برند. جمینی می تواند به طور انعطاف پذیر از قابلیت تفکر برای کارهایی مانند:
    • فتوسنتز و بزرگ شدن را آنالوگ کنید.
    • مقایسه و مقایسه خودروهای الکتریکی و خودروهای هیبریدی.
  • وظایف سخت (حداکثر قابلیت تفکر): برای چالش‌های واقعاً پیچیده، هوش مصنوعی باید توانایی‌های استدلال و برنامه‌ریزی کامل خود را درگیر کند، که اغلب شامل بسیاری از مراحل داخلی قبل از ارائه پاسخ است. مثالها عبارتند از:
    • حل مسئله 1 در AIME 2025: مجموع همه پایه های اعداد صحیح b > 9 را پیدا کنید که 17 b مقسوم علیه 97 b است.
    • کد پایتون را برای یک برنامه وب بنویسید که داده های بازار سهام را در زمان واقعی، از جمله احراز هویت کاربر، تجسم می کند. آن را تا حد امکان کارآمد کنید.

بعدش چی؟

  • Gemini 2.5 Pro Preview را در Google AI Studio امتحان کنید.
  • برای اطلاعات بیشتر در مورد پیش نمایش Gemini 2.5 Pro و Gemini Flash 2.0 Thinking، به صفحه مدل مراجعه کنید.
  • نمونه های بیشتری را در کتاب آشپزی Thinking امتحان کنید.