ویژگیهای جدید Gemini 3.5 Flash
Gemini 3.5 Flash به طور کلی در دسترس (GA) ، پایدار و آماده برای استفاده در مقیاس بزرگ است. به عنوان هوشمندترین مدل Flash ما، عملکرد پایدار و مرزی را در اجرای عامل، کدنویسی و وظایف بلندمدت در مقیاس بزرگ ارائه میدهد.
این راهنما شامل مروری بر بهبودها، تغییرات API و راهنماییهای مهاجرت برای Gemini 3.5 Flash است.
مدل جدید
| مدل | شناسه مدل | توضیحات |
|---|---|---|
| فلش جمینی ۳.۵ | gemini-3.5-flash | هوشمندترین مدل ما برای عملکرد مرزی پایدار در وظایف عاملدار و کدنویسی. |
Gemini 3.5 Flash از پنجره زمینه ۱ میلیون توکن، حداکثر ۶۵ هزار توکن خروجی، تفکر و همان مجموعه ابزارها و ویژگیهای پلتفرم Gemini 3 Flash پشتیبانی میکند. در حال حاضر استفاده از کامپیوتر پشتیبانی نمیشود.
برای مشخصات کامل، به نمای کلی مدلها مراجعه کنید. برای قیمتگذاری، به صفحه قیمتگذاری مراجعه کنید.
شروع سریع
تمام مثالهای این راهنما از Interactions API استفاده میکنند. GenerateContent API نیز پشتیبانی میشود؛ همان گزینهها و توصیههای پیکربندی اعمال میشوند.
پایتون
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Explain how parallel agentic execution works in three sentences."
)
print(interaction.output_text)
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
async function main() {
const interaction = await client.interactions.create({
model: "gemini-3.5-flash",
input: "Explain how parallel agentic execution works in three sentences.",
});
console.log(interaction.output_text);
}
main();
استراحت
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-H "Api-Revision: 2026-05-20" \
-d '{
"model": "gemini-3.5-flash",
"input": "Explain how parallel agentic execution works in three sentences."
}'
چه خبر؟
- عملکرد پایدار و پیشرو: هوشمندترین مدل فلش ما، بهینه شده برای وظایف عاملمحور و کدنویسی در مقیاس بزرگ.
- اجرای عاملمحور: استقرار عاملمحور فرعی، حل مسئله و حلقههای عاملمحور سریع در مقیاس بزرگ.
- کدنویسی: چرخههای کدنویسی تکراری، کاوش سریع و نمونهسازی اولیه برای آزمایش مسیرهای جایگزین و کشف پویای راهحلها.
- افق بلندمدت: گردشهای کاری چند مرحلهای و استفاده از ابزار در مقیاس بزرگ.
- حفظ تفکر: این مدل به طور خودکار استدلال میانی را در مکالمات چند نوبتی حفظ میکند. نیازی به تغییر API نیست.
- سطح تلاش پیشفرض جدید: تلاش فکری پیشفرض از
highبهmediumتغییر کرد. برای جزئیات بیشتر به سطح تلاش پیشفرض جدید مراجعه کنید. - بهبود تفکر
low: اکنونlowبرای کد و وظایف عاملی که به مراحل کمتری نیاز دارند، به طور قابل توجهی بهبود یافته است و کیفیت قوی را با تأخیر و هزینه کمتر ارائه میدهد. - انتشار GA: مدل پایدار برای استفاده در مقیاس تولید.
تغییرات رفتاری
سطح تلاش پیشفرض جدید: medium
تلاش فکری پیشفرض اکنون medium است، که در پیشنمایش فلش Gemini 3 از high تغییر یافته است. medium نتایج بسیار خوبی را در طیف وسیعی از وظایف ارائه میدهد و در عین حال سریعتر و مقرونبهصرفهتر است. برای مسائل پیچیده، high مدل را به تفکر عمیقتر تشویق میکند.
| سطح تلاش | چه زمانی استفاده شود |
|---|---|
minimal | بهینه شده برای سرعت پاسخگویی. موارد استفاده چت مانند، پاسخهای سریع و مبتنی بر واقعیت، فراخوانیهای ابزار سادهتر. |
low | کدنویسی و وظایف عاملی که به تأخیر کمتر و مراحل کمتری نیاز دارند. همچنین برای وظایف تحلیلی و نوشتاری که نیاز به تفکر دارند، به خوبی کار میکند. |
medium (پیشفرض) | بهترین کیفیت برای اکثر وظایف. برای کدهای پیچیده و موارد استفادهی عاملی توصیه میشود. |
high | توانایی مدل را برای تفکر و استفاده از ابزارها به حداکثر میرساند. بهترین گزینه برای استدلال پیچیده، ریاضیات سخت و دشوارترین وظایف کد یا عامل. امکان تفکرات گسترده و فراخوانی توابع را فراهم میکند. |
برای لغو پیشفرض، thinking_level در پیکربندی خود تنظیم کنید:
پایتون
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Prove that the square root of 2 is irrational.",
generation_config={"thinking_level": "high"},
)
print(interaction.output_text)
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
async function main() {
const interaction = await client.interactions.create({
model: "gemini-3.5-flash",
input: "Prove that the square root of 2 is irrational.",
generationConfig: { thinkingLevel: "high" },
});
console.log(interaction.output_text);
}
main();
استراحت
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-H "Api-Revision: 2026-05-20" \
-d '{
"model": "gemini-3.5-flash",
"input": "Prove that the square root of 2 is irrational.",
"generation_config": {"thinking_level": "high"}
}'
حفظ اندیشه
این مدل به طور خودکار استدلال میانی را در مکالمات چند نوبتی حفظ میکند. وقتی در تاریخچه مکالمه وجود داشته باشد، زمینه استدلال به جلو منتقل میشود که عملکرد را در کارهای پیچیده چند مرحلهای مانند اشکالزدایی تکراری و اصلاح کد بهبود میبخشد. هیچ تغییر API لازم نیست:
- API تعاملات : افکار از قبل به طور خودکار ذخیره میشوند. هیچ تغییری در رفتار ایجاد نمیشود.
- API تولید محتوا : با شروع از Gemini 3.5 Flash، مدل از تمام نوبتهای قبلی، زمانی که امضاهای فکری در تاریخچه مکالمه وجود دارند، برای استدلال استفاده میکند. برای فعال کردن این قابلیت، تاریخچه کامل و بدون تغییر مکالمه (شامل امضاهای فکری ) را در
contentsارسال کنید. SDKها این کار را به طور خودکار انجام میدهند.
بهروزرسانیهای پارامتر و بهترین شیوهها در Gemini 3.x
موارد زیر در مورد همه مدلهای Gemini 3.x ، از جمله Gemini 3.5 Flash، صدق میکند.
-
temperature،top_p،top_k: اکیداً توصیه میکنیم مقادیر پیشفرض را تغییر ندهید. قابلیتهای استدلال Gemini 3 برای تنظیمات پیشفرض بهینه شدهاند. - به جای
thinking_budgetازthinking_levelاستفاده کنید. - تطبیق پاسخ فراخوانی تابع :
id،nameو تعداد پاسخ باید با فراخوانیهای قبلی مطابقت داشته باشند. - پاسخهای تابع چندوجهی : محتوای چندوجهی را درون پاسخ تابع قرار دهید، نه بیرون آن.
- دستورالعملهای درونخطی در پاسخهای تابع : به متن پاسخ تابع اضافه میشوند، نه به صورت بخشهای جداگانه.
- کاهش فراخوانیهای ابزار غیرضروری : از سطوح تفکر پایینتر استفاده کنید یا دستورالعملهای سیستمی را آزمایش کنید تا فراخوانیهای ابزار را در گردشهای کاری عاملمحور کاهش دهید.
برای نحوه بهروزرسانی کد خود، به بخشهای زیر مراجعه کنید.
پارامترهای نمونهبرداری (دیگر توصیه نمیشود)
temperature ، top_p و top_k دیگر برای همه مدلهای Gemini 3.x توصیه نمیشوند. قابلیتهای استدلال Gemini 3 برای تنظیمات پیشفرض بهینه شدهاند. این پارامترها را از همه درخواستها حذف کنید.
# ⚠️ Remove these parameters (not recommended)
generation_config = {
"temperature": 0.7,
"top_p": 0.9,
"top_k": 40,
}
برای اطمینان از قطعیت، توصیه میکنیم یک دستورالعمل سیستمی با قوانین صریح برای مورد استفاده خاص خود تعریف کنید.
thinking_budget (دیگر توصیه نمیشود)
پارامتر عددی خام thinking_budget دیگر در تمام مدلهای Gemini 3.x توصیه نمیشود. به جای آن از enum رشتهای thinking_level استفاده کنید.
# ⚠️ Before (not recommended)
generation_config = {
"thinking": {"thinking_budget": 7500},
}
# ✅ After
generation_config = {
"thinking": {"thinking_level": "medium"},
}
مقادیر موجود: minimal ، low ، medium (پیشفرض) و high .
فراخوانی تابع: تطبیق دقیق پاسخ
API تعاملات (Interactions API) از قبل در مورد پاسخهای تابع نامتناسب خطا میدهد. API تولید محتوا (GenerateContent API) هنوز خطا نمیدهد، اما پاسخهای نامتناسب باعث میشوند مدل در بیشتر موارد پاسخهای خالی با finish_reason: STOP برگرداند. همیشه از این قراردادها پیروی کنید:
| مورد نیاز | جزئیات |
|---|---|
id را وارد کنید | هر FunctionResponse باید شامل id از FunctionCall مربوطه باشد. |
name مسابقه | name در پاسخ باید با name در فراخوانی مطابقت داشته باشد |
| تعداد تطابقها | دقیقاً یک FunctionResponse برای هر FunctionCall دریافتی برمیگرداند |
پایتون
# ✅ Include matching call_id and name in the function_result
final_interaction = client.interactions.create(
model="gemini-3.5-flash",
previous_interaction_id=interaction.id,
tools=[my_tool],
input=[{
"type": "function_result",
"name": fc_step.name,
"call_id": fc_step.id,
"result": [{"type": "text", "text": json.dumps(result)}],
}],
)
جاوا اسکریپت
// ✅ Include matching call_id and name in the function_result
const finalInteraction = await client.interactions.create({
model: "gemini-3.5-flash",
previousInteractionId: interaction.id,
tools: [myTool],
input: [{
type: "function_result",
name: fcStep.name,
call_id: fcStep.id,
result: [{ type: "text", text: JSON.stringify(result) }],
}],
});
استراحت
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-H "Api-Revision: 2026-05-20" \
-d '{
"model": "gemini-3.5-flash",
"previous_interaction_id": "<INTERACTION_ID>",
"tools": [...],
"input": [{
"type": "function_result",
"name": "my_function",
"call_id": "<CALL_ID>",
"result": [{"type": "text", "text": "..."}]
}]
}'
پاسخهای تابع چندوجهی
ما اغلب میبینیم که مشتریان تصاویری خارج از پاسخ تابع ارائه میدهند. این میتواند منجر به رفتار غیرمنتظره مدل (مثلاً نشت اطلاعات) و در نتیجه خروجیهای با کیفیت پایینتر شود. در عوض، توصیههای موجود در مستندات API پاسخهای تابع چندوجهی را دنبال کنید و محتوای چندوجهی را در بخشهای پاسخ تابعی که به مدل ارسال میکنید، بگنجانید. مدل میتواند این محتوای چندوجهی را در نوبت بعدی خود پردازش کند تا پاسخی آگاهانهتر تولید کند.
پایتون
# ✅ Include multimodal content in the function response
final_interaction = client.interactions.create(
model="gemini-3.5-flash",
previous_interaction_id=interaction.id,
input=[
{
"type": "function_result",
"name": tool_call.name,
"call_id": tool_call.id,
"result": [
{"type": "text", "text": "instrument.jpg"},
{
"type": "image",
"mime_type": "image/jpeg",
"data": base64_image_data,
},
],
}
],
)
جاوا اسکریپت
// ✅ Include multimodal content in the function response
const finalInteraction = await client.interactions.create({
model: "gemini-3.5-flash",
previousInteractionId: interaction.id,
input: [{
type: "function_result",
name: toolCall.name,
call_id: toolCall.id,
result: [
{ type: "text", text: "instrument.jpg" },
{
type: "image",
mime_type: "image/jpeg",
data: base64ImageData,
},
],
}],
});
دستورالعملهای درونخطی در پاسخهای تابع
ما اغلب میبینیم که کلاینتها دستورالعملهای اضافی را همراه با پاسخهای تابع به عنوان Parts بعدی ارائه میدهند. این میتواند منجر به رفتار غیرمنتظره مدل (مثلاً نشت فکر) و در نتیجه خروجیهای با کیفیت پایینتر شود. در عوض، هرگونه دستورالعمل اضافی را به انتهای متن پاسخ تابع اضافه کنید و با دو خط جدید از هم جدا کنید.
پایتون
# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"
final_interaction = client.interactions.create(
model="gemini-3.5-flash",
previous_interaction_id=interaction.id,
tools=[my_tool],
input=[{
"type": "function_result",
"name": fc_step.name,
"call_id": fc_step.id,
"result": [{"type": "text", "text": result_text}],
}],
)
جاوا اسکریپت
// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;
const finalInteraction = await client.interactions.create({
model: "gemini-3.5-flash",
previousInteractionId: interaction.id,
tools: [myTool],
input: [{
type: "function_result",
name: fcStep.name,
call_id: fcStep.id,
result: [{ type: "text", text: resultText }],
}],
});
کاهش فراخوانیهای غیرضروری ابزار
اگر با مشکل استفاده بیش از حد از ابزارهای تماسی مواجه شدید، دو تکنیک به کاهش آنها کمک میکند:
با کاهش سطح تفکر (
medium،lowیاminimal) شروع کنید: سطوح تفکر بالاتر، مدل را تشویق میکند تا از ابزارهای بیشتری برای کاوش و تأیید استفاده کند، بنابراین کاهش سطح میتواند فراخوانی ابزارها را کاهش دهد.یک دستورالعمل سیستمی اضافه کنید: اگر پس از تنظیم سطح تفکر، استفاده بیش از حد ادامه یافت، دستورالعملی را در نظر بگیرید که استفاده از ابزار را محدود کند. برای مثال:
You have a limited action budget of <n> tool calls. Use them efficiently.
چک لیست مهاجرت
اکیداً توصیه میکنیم که google-genai SDK نسخه ۲.۰.۰ یا بالاتر را بهروزرسانی کنید. این نسخه تغییرات اساسی در Interactions API ایجاد میکند. برای جزئیات بیشتر به راهنمای مهاجرت تغییرات اساسی مراجعه کنید.
مهاجرت از پیشنمایش فلش Gemini 3
- نام مدل را بهروزرسانی کنید:
gemini-3-flash-preview→gemini-3.5-flash - بررسی قیمتها. Gemini 3.5 Flash گرانتر از Gemini 3 Flash Preview است. برای جزئیات بیشتر به صفحه قیمتها مراجعه کنید.
-
temperature،top_pوtop_kرا از پیکربندی خود حذف کنید (دیگر توصیه نمیشود). -
thinking_budgetباthinking_levelجایگزین کنید. -
idوnameمنطبق را به تمام بخشهایFunctionResponseاضافه کنید. - درخواستهای خود را آزمایش کنید. میزان تلاش پیشفرض از
highبهmediumتغییر کرد؛ کیفیت، سرعت و هزینه را بررسی کنید. - حفظ فکر اکنون به طور پیشفرض فعال است. زمینه استدلال در طول نوبتها ادامه مییابد که باعث بهبود عملکرد میشود اما ممکن است استفاده از توکن را افزایش دهد.
- تماسهای غیرضروری با ابزار را کاهش دهید: با کاهش سطح تفکر (
medium،lowیاminimal) شروع کنید؛ در صورت تداوم استفاده بیش از حد، یک دستورالعمل سیستمی برای محدود کردن استفاده از ابزار اضافه کنید. - در حال حاضر، استفاده از کامپیوتر در Gemini 3.5 Flash پشتیبانی نمیشود. برای حجم کاری استفاده از کامپیوتر، به استفاده از Gemini 3 Flash Preview ادامه دهید.
مهاجرت از جمینی ۲.۵
همه موارد فوق، به علاوه:
- سادهسازی دستورالعملها. اگر از مهندسی دستورالعمل زنجیرهای برای وادار کردن دانشآموزان به استدلال استفاده کردهاید، به جای آن
thinking_level: "medium"یا"high"را با دستورالعملهای سادهتر امتحان کنید. - حجم کار PDF و رسانه را آزمایش کنید. اگر برای تجزیه و تحلیل متراکم اسناد به رفتار خاصی متکی هستید، تنظیم
media_resolution_highرا آزمایش کنید تا از دقت مداوم اطمینان حاصل شود. مهاجرت به پیشفرضهای Gemini 3 همچنین ممکن است استفاده از توکن را برای PDFها افزایش دهد اما آن را برای ویدیو کاهش دهد. اگر درخواستها از پنجره زمینه فراتر رود، صراحتاًmedia_resolutionرا کاهش دهید. برای جزئیات بیشتر به اسناد وضوح رسانه مراجعه کنید. - از ابزارهای ترکیبی استفاده کنید . جستجوی گوگل، متن URL، اجرای کد و توابع سفارشی میتوانند در یک درخواست واحد استفاده شوند.
- اگر از پاسخهای تابع چندوجهی استفاده میکنید، محتوای چندوجهی را درون بخشهای پاسخ تابع قرار دهید، نه در کنار آنها.
- اگر از دستورالعملهای درونخطی با پاسخهای تابع استفاده میکنید، آنها را به متن پاسخ تابع اضافه کنید و با دو خط جدید از هم جدا کنید، نه به عنوان بخشهای جداگانه.
- قطعهبندی تصویر در Gemini 3.x پشتیبانی نمیشود. برای حجم کاری قطعهبندی، با در نظر گرفتن موارد زیر، به استفاده از Gemini 2.5 Flash یا Gemini Robotics-ER 1.6 ادامه دهید.
ویژگیهای خانوادگی جمینی ۳
Gemini 3.5 Flash تمام قابلیتهای خانواده Gemini 3 به جز استفاده از کامپیوتر را به ارث میبرد. ویژگیهای معرفی شده در Gemini 3 که به نسخههای بعدی نیز منتقل شدهاند:
- تفکر : زمینه استدلال رمزگذاری شده در سراسر فراخوانیهای API حفظ میشود. خودکار در API تعاملات؛ ضمنی در GenerateContent.
- خروجیهای ساختاریافته با ابزارها : حالت JSON را با ابزارهای داخلی (جستجو، متن URL، اجرای کد، فراخوانی تابع) ترکیب کنید.
- پاسخهای تابع چندوجهی : تصاویر، صدا و سایر رسانهها را در نتایج فراخوانی تابع برمیگرداند.
- اجرای کد با تصاویر : اجرای کدی که تصاویر را پردازش و تولید میکند.
- استفاده ترکیبی از ابزار : استفاده از ابزارهای داخلی و فراخوانی توابع سفارشی در یک درخواست واحد.
مراحل بعدی
- برای اطلاعات بیشتر در مورد خانواده Gemini 3، راهنمای توسعهدهندگان Gemini 3 را مطالعه کنید.
- در راهنمای مهندسی سریع، درباره استراتژیهای طراحی سریع بیشتر بیاموزید.
- با کتاب آشپزی Gemini 3 شروع کنید
- درباره بهینهسازی و استنتاج API Gemini اطلاعات کسب کنید