Gemini 3.5 Flash'teki yenilikler
Gemini 3.5 Flash, genel kullanıma sunulmuş (GK), kararlı ve ölçeklendirilmiş üretim kullanımına hazırdır. En akıllı Flash modelimiz olan bu model, ajan tabanlı yürütme, kodlama ve uzun vadeli görevlerde ölçekli olarak sürekli en üst düzeyde performans sunar.
Bu kılavuzda, Gemini 3.5 Flash ile ilgili iyileştirmeler, API değişiklikleri ve taşıma yönergeleri hakkında genel bilgiler yer almaktadır.
Yeni model
| Model | Model Kimliği | Açıklama |
|---|---|---|
| Gemini 3.5 Flash | gemini-3.5-flash |
Ajan tabanlı ve kodlama görevlerinde sürekli olarak en iyi performansı sunan en akıllı modelimiz. |
Gemini 3.5 Flash, 1 milyon parçalık bağlam penceresini, 65 bin maksimum çıkış parçası sayısını, düşünme özelliğini ve Gemini 3 Flash ile aynı araç ve platform özelliklerini destekler. Bilgisayar Kullanımı şu anda desteklenmemektedir.
Tüm özellikler için modellere genel bakış başlıklı makaleyi inceleyin. Fiyatlandırma için fiyatlandırma sayfasına bakın.
Hızlı başlangıç kılavuzu
Bu kılavuzdaki tüm örneklerde Etkileşimler API'si kullanılmaktadır. Aynı yapılandırma seçenekleri ve öneriler geçerli olmak üzere GenerateContent API de desteklenir.
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Explain how parallel agentic execution works in three sentences."
)
print(interaction.output_text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
async function main() {
const interaction = await client.interactions.create({
model: "gemini-3.5-flash",
input: "Explain how parallel agentic execution works in three sentences.",
});
console.log(interaction.output_text);
}
main();
REST
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-H "Api-Revision: 2026-05-20" \
-d '{
"model": "gemini-3.5-flash",
"input": "Explain how parallel agentic execution works in three sentences."
}'
Yenilikler
- Sürekli olarak en üst düzey performans: En akıllı Flash modelimiz, büyük ölçekte ajan ve kodlama görevleri için optimize edilmiştir.
- Ajan benzeri yürütme: Alt ajan dağıtımı, sorun çözme ve büyük ölçekte hızlı ajan benzeri döngüler.
- Kodlama: Alternatif yolları test etmek ve çözümleri dinamik olarak keşfetmek için yinelemeli kodlama döngüleri, hızlı keşif ve prototip oluşturma.
- Uzun vadeli: Çok adımlı iş akışları ve araçların büyük ölçekte kullanımı.
- Düşünce koruma: Model, çok turlu sohbetlerde ara muhakemeyi otomatik olarak korur. API'de değişiklik yapılması gerekmez.
- Yeni varsayılan çaba düzeyi: Varsayılan düşünme çabası
highdeğerindenmediumdeğerine değiştirildi. Ayrıntılar için Yeni varsayılan çaba düzeyi başlıklı makaleyi inceleyin. - Geliştirilmiş
lowdüşünme:low, artık daha az adım gerektiren kod ve aracı görevleri için önemli ölçüde geliştirildi. Daha düşük gecikme süresi ve maliyetle yüksek kalite sunuyor. - GA sürümü: Ölçeklendirilmiş üretim kullanımı için kararlı model.
Davranış değişiklikleri
Yeni varsayılan çaba düzeyi: medium
Varsayılan düşünme çabası, Gemini 3 Flash önizlemesindeki high'ten medium'ye değiştirildi. medium daha hızlı ve daha uygun maliyetli olmasının yanı sıra çok çeşitli görevlerde çok iyi sonuçlar verir. Karmaşık sorunlarda high
modelin daha derinlemesine düşünmesini sağlar.
| Çaba düzeyi | Ne zaman kullanılır? |
|---|---|
minimal |
Yanıt hızı için optimize edilmiştir. Sohbet benzeri kullanım alanları, hızlı bilgi yanıtları, daha basit araç çağrıları. |
low |
Daha düşük gecikme süresi ve daha az adım gerektiren kodlama ve yapay zeka görevleri. Biraz düşünmeyi gerektiren analiz ve yazma görevleri için de uygundur. |
medium (varsayılan) |
Çoğu görev için en iyi kalite. Karmaşık kod ve aracı kullanım alanları için önerilir. |
high |
Modelin düşünme ve araç kullanma becerisini en üst düzeye çıkarır. Karmaşık akıl yürütme, zor matematik ve en zor kod ya da aracı görevleri için idealdir. Genişletilmiş düşüncelere ve işlev çağrılarına olanak tanır. |
Varsayılanı geçersiz kılmak için yapılandırmanızda thinking_level değerini ayarlayın:
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Prove that the square root of 2 is irrational.",
generation_config={"thinking_level": "high"},
)
print(interaction.output_text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const client = new GoogleGenAI({});
async function main() {
const interaction = await client.interactions.create({
model: "gemini-3.5-flash",
input: "Prove that the square root of 2 is irrational.",
generationConfig: { thinkingLevel: "high" },
});
console.log(interaction.output_text);
}
main();
REST
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-H "Api-Revision: 2026-05-20" \
-d '{
"model": "gemini-3.5-flash",
"input": "Prove that the square root of 2 is irrational.",
"generation_config": {"thinking_level": "high"}
}'
Düşünceleri koruma
Model, çok adımlı sohbetlerdeki ara muhakemeyi otomatik olarak korur. Sohbet geçmişinde yer aldığında akıl yürütme bağlamı devam eder. Bu da yinelemeli hata ayıklama ve kod yeniden düzenleme gibi karmaşık çok adımlı görevlerde performansı artırır. API'de değişiklik yapılması gerekmez:
- Interactions API: Düşünceler otomatik olarak korunur. Davranışta değişiklik yok.
- GenerateContent API: Gemini 3.5 Flash'tan itibaren model, görüşme geçmişinde düşünce imzaları varsa önceki tüm aşamalardaki akıl yürütme bağlamını kullanır. Bunu etkinleştirmek için
contentsiçinde tam ve değiştirilmemiş sohbet geçmişini (düşünce imzaları dahil) iletin. SDK'lar bunu otomatik olarak yapar.
Gemini 3.x'teki parametre güncellemeleri ve en iyi uygulamalar
Gemini 3.5 Flash dahil olmak üzere tüm Gemini 3.x modelleri için aşağıdakiler geçerlidir.
temperature,top_p,top_k: Varsayılan değerlerin değiştirilmemesini önemle tavsiye ederiz. Gemini 3'ün akıl yürütme özellikleri, varsayılan ayarlar için optimize edilmiştir.thinking_budgetyerinethinking_levelkullanın.- İşlev çağrısı yanıtı eşleştirme:
id,nameve yanıt sayısı önceki çağrılarla eşleşmelidir. - Çok formatlı işlev yanıtları: Çok formatlı içerik, işlev yanıtının dışında değil içinde yer almalıdır.
- İşlev yanıtlarındaki satır içi talimatlar: Ayrı parçalar olarak değil, işlev yanıtı metnine eklenir.
- Gereksiz araç çağrılarını azaltma: Düşünme seviyelerini düşürün veya sistem talimatlarıyla denemeler yaparak aracılı iş akışlarındaki araç çağrılarını azaltın.
Kodunuzu nasıl güncelleyeceğinizi öğrenmek için aşağıdaki bölümlere bakın.
Örnekleme parametreleri (artık önerilmemektedir)
temperature, top_p ve top_k artık tüm Gemini 3.x modelleri için önerilmiyor. Gemini 3'ün muhakeme özellikleri, varsayılan ayarlar için optimize edilmiştir. Bu parametreleri tüm isteklerden kaldırın.
# ⚠️ Remove these parameters (not recommended)
generation_config = {
"temperature": 0.7,
"top_p": 0.9,
"top_k": 40,
}
Belirlenimi sağlamak için belirli kullanım alanınızla ilgili açık kurallar içeren bir sistem talimatı tanımlamanızı öneririz.
thinking_budget (artık önerilmiyor)
Ham sayısal thinking_budget parametresinin tüm Gemini 3.x modellerinde kullanılması artık önerilmiyor. Bunun yerine thinking_level dize numarasını kullanın.
# ⚠️ Before (not recommended)
generation_config = {
"thinking": {"thinking_budget": 7500},
}
# ✅ After
generation_config = {
"thinking": {"thinking_level": "medium"},
}
Kullanılabilir değerler: minimal, low, medium (varsayılan) ve high.
İşlev çağırma: katı yanıt eşleştirme
Etkileşimler API'si, eşleşmeyen işlev yanıtları için zaten hata veriyor. GenerateContent API henüz hata vermiyor ancak eşleşmeyen yanıtlar, modelin çoğu durumda finish_reason: STOP ile boş yanıtlar döndürmesine neden oluyor. Her zaman aşağıdaki kurallara uyun:
| Gereksinim | Ayrıntılar |
|---|---|
id içerir |
Her FunctionResponse, ilgili FunctionCall öğesindeki id öğesini içermelidir. |
name. maç |
Yanıtın name değeri, görüşmedeki name değeriyle eşleşmelidir. |
| Eşleşme sayıları | Alınan her FunctionCall için tam olarak bir FunctionResponse döndürün. |
Python
# ✅ Include matching call_id and name in the function_result
final_interaction = client.interactions.create(
model="gemini-3.5-flash",
previous_interaction_id=interaction.id,
tools=[my_tool],
input=[{
"type": "function_result",
"name": fc_step.name,
"call_id": fc_step.id,
"result": [{"type": "text", "text": json.dumps(result)}],
}],
)
JavaScript
// ✅ Include matching call_id and name in the function_result
const finalInteraction = await client.interactions.create({
model: "gemini-3.5-flash",
previousInteractionId: interaction.id,
tools: [myTool],
input: [{
type: "function_result",
name: fcStep.name,
call_id: fcStep.id,
result: [{ type: "text", text: JSON.stringify(result) }],
}],
});
REST
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-H "Api-Revision: 2026-05-20" \
-d '{
"model": "gemini-3.5-flash",
"previous_interaction_id": "<INTERACTION_ID>",
"tools": [...],
"input": [{
"type": "function_result",
"name": "my_function",
"call_id": "<CALL_ID>",
"result": [{"type": "text", "text": "..."}]
}]
}'
Çok formatlı işlev yanıtları
Müşterilerin genellikle işlev yanıtı dışında resimler sağladığını görüyoruz. Bu durum, beklenmedik model davranışlarına (ör. düşünce sızıntısı) ve daha düşük kaliteli çıktılara yol açabilir. Bunun yerine Multimodal Function Responses API dokümanlarındaki öneriyi uygulayın ve modele gönderdiğiniz işlev yanıtı bölümlerine çok formatlı içerik ekleyin. Model, daha bilinçli bir yanıt üretmek için bu çok formatlı içeriği bir sonraki adımda işleyebilir.
Python
# ✅ Include multimodal content in the function response
final_interaction = client.interactions.create(
model="gemini-3.5-flash",
previous_interaction_id=interaction.id,
input=[
{
"type": "function_result",
"name": tool_call.name,
"call_id": tool_call.id,
"result": [
{"type": "text", "text": "instrument.jpg"},
{
"type": "image",
"mime_type": "image/jpeg",
"data": base64_image_data,
},
],
}
],
)
JavaScript
// ✅ Include multimodal content in the function response
const finalInteraction = await client.interactions.create({
model: "gemini-3.5-flash",
previousInteractionId: interaction.id,
input: [{
type: "function_result",
name: toolCall.name,
call_id: toolCall.id,
result: [
{ type: "text", text: "instrument.jpg" },
{
type: "image",
mime_type: "image/jpeg",
data: base64ImageData,
},
],
}],
});
İşlev yanıtlarında satır içi talimatlar
Müşterilerin, işlev yanıtlarıyla birlikte ek talimatlar sağladığını sıklıkla görüyoruz
sonraki Parts. Bu durum, modelin beklenmedik şekilde davranmasına (ör. düşünce sızıntısı) ve daha düşük kaliteli çıkışlar üretmesine neden olabilir. Bunun yerine, ek talimatları iki yeni satırla ayrılmış şekilde işlev yanıtı metninin sonuna ekleyin.
Python
# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"
final_interaction = client.interactions.create(
model="gemini-3.5-flash",
previous_interaction_id=interaction.id,
tools=[my_tool],
input=[{
"type": "function_result",
"name": fc_step.name,
"call_id": fc_step.id,
"result": [{"type": "text", "text": result_text}],
}],
)
JavaScript
// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;
const finalInteraction = await client.interactions.create({
model: "gemini-3.5-flash",
previousInteractionId: interaction.id,
tools: [myTool],
input: [{
type: "function_result",
name: fcStep.name,
call_id: fcStep.id,
result: [{ type: "text", text: resultText }],
}],
});
Gereksiz araç çağrılarını azaltma
Araç çağrılarını aşırı kullanma sorunu yaşıyorsanız bu sorunu en aza indirmenize yardımcı olacak iki teknik vardır:
Düşünme düzeyini azaltarak başlayın (
medium,lowveyaminimal): Daha yüksek düşünme düzeyleri, modelin keşfetmek ve doğrulamak için daha fazla araç kullanmasını teşvik eder. Bu nedenle, düzeyi düşürmek araç çağrılarını azaltabilir.Sistem talimatı ekleyin: Düşünme düzeyi ayarlandıktan sonra aşırı kullanım devam ederse araç kullanımını kısıtlayan bir istem kullanmayı deneyin. Örneğin:
You have a limited action budget of <n> tool calls. Use them efficiently.
Taşıma kontrol listesi
google-genai SDK'nın 2.0.0 veya sonraki bir sürümüne güncellemenizi önemle tavsiye ederiz. Bu sürümde, Interactions API'de uyumluluğu bozan değişiklikler yapılmıştır. Ayrıntılar için API'de yapılan ve geriye dönük uyumluluğu bozan değişikliklerle ilgili taşıma kılavuzuna bakın.
Gemini 3 Flash önizlemesinden taşıma
- Model adını güncelleme:
gemini-3-flash-preview→gemini-3.5-flash - Fiyatlandırmayı inceleyin. Gemini 3.5 Flash, Gemini 3 Flash Önizleme sürümünden daha pahalıdır. Ayrıntılar için fiyatlandırma sayfasına göz atın.
temperature,top_p,top_köğelerini yapılandırmanızdan kaldırın (artık önerilmemektedir).thinking_budgetyerinethinking_levelkoyun.- Tüm
FunctionResponsebölümlerineidve eşleşennamedeğerlerini ekleyin. - İstemlerinizi test edin. Varsayılan çaba
high→mediumolarak değiştirildi. Kaliteyi, hızı ve maliyeti doğrulayın. - Düşünce koruma özelliği artık varsayılan olarak etkindir. Muhakeme bağlamı, dönüşümler arasında aktarılır. Bu durum performansı artırır ancak jeton kullanımını yükseltebilir.
- Gereksiz araç çağrılarını azaltın: Düşünme düzeyini azaltarak başlayın (
medium,lowveyaminimal). Aşırı kullanım devam ederse araç kullanımını kısıtlamak için bir sistem talimatı ekleyin. - Bilgisayar Kullanımı şu anda Gemini 3.5 Flash'te desteklenmemektedir. Bilgisayar Kullanımı iş yükleri için Gemini 3 Flash Preview'u kullanmaya devam edin.
Gemini 2.5'ten taşıma
Yukarıdakilerin tümüne ek olarak:
- İstemleri basitleştirin. Muhakeme yapmayı zorlamak için zincirleme düşünce istem mühendisliği kullandıysanız bunun yerine daha basit istemlerle
thinking_level: "medium"veya"high"'yi deneyin. - PDF ve medya iş yüklerini test edin. Yoğun doküman ayrıştırma için belirli bir davranışa güveniyorsanız doğruluğun devamlılığını sağlamak üzere
media_resolution_highayarını test edin. Varsayılan olarak Gemini 3'e geçiş yapmak, PDF'lerde jeton kullanımını artırabilir ancak videolarda azaltabilir. İstekler bağlam penceresini aşarsamedia_resolutiondeğerini açıkça azaltın. Ayrıntılar için medya çözünürlüğü belgelerine bakın. - Araçları birlikte kullanmaktan yararlanın. Google Arama, URL bağlamı, kod yürütme ve özel işlevler aynı istekte kullanılabilir.
- Çok formatlı işlev yanıtları kullanıyorsanız çok formatlı içeriği işlev yanıtı bölümlerinin içine taşıyın, yanına değil.
- İşlev yanıtlarıyla satır içi talimatlar kullanılıyorsa bunları ayrı parçalar olarak değil, iki yeni satırla ayrılmış şekilde işlev yanıtı metnine ekleyin.
- Görüntü segmentasyonu, Gemini 3.x'te desteklenmez. Segmentasyon iş yükleri için düşünme özelliği devre dışı bırakılmış Gemini 2.5 Flash'ı veya Gemini Robotics-ER 1.6'yı kullanmaya devam edin.
Gemini 3 ailesinin özellikleri
Gemini 3.5 Flash, Bilgisayar Kullanımı hariç tüm Gemini 3 ailesi özelliklerini devralır. Gemini 3'te kullanıma sunulan ve devam eden özellikler:
- Düşünme: Şifrelenmiş API çağrıları arasında akıl yürütme bağlamı korunur. Etkileşimler API'sinde otomatik, GenerateContent'te ise örtülü.
- Araçlarla yapılandırılmış çıkışlar: JSON modunu yerleşik araçlarla (arama, URL bağlamı, kod yürütme, işlev çağrısı) birleştirin.
- Çok formatlı işlev yanıtları: İşlev çağrısı sonuçlarında resim, ses ve diğer medya türlerini döndürün.
- Görüntülerle kod yürütme: Görüntüleri işleyen ve oluşturan kodları yürütün.
- Birleşik araç kullanımı: Yerleşik araçları ve özel işlev çağrılarını aynı istekte kullanın.
Sonraki adımlar
- Gemini 3 ailesi hakkında daha fazla bilgiyi Gemini 3 geliştirici kılavuzunda bulabilirsiniz.
- İstem mühendisliği kılavuzundan istem tasarımı stratejileri hakkında daha fazla bilgi edinin.
- Gemini 3 Cookbook'u kullanmaya başlayın
- Gemini API optimizasyonu ve çıkarımı hakkında bilgi edinin.