Gemini Deep Research artık işbirlikçi planlama, görselleştirme, MCP desteği ve daha fazlasıyla önizleme sürümünde kullanılabilir.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3.5 Flash'teki yenilikler

Not: Sayfanın bu sürümünde, şu anda beta sürümünde olan yeni Etkileşimler API'si ele alınmaktadır.
Kararlı üretim dağıtımları için generateContent API'yi kullanmaya devam etmenizi öneririz. Sürümler arasında geçiş yapmak için bu sayfadaki açma/kapatma düğmesini kullanabilirsiniz.

Gemini 3.5 Flash, genel kullanıma sunulmuş (GK), kararlı ve ölçeklendirilmiş üretim kullanımına hazırdır. En akıllı Flash modelimiz olan bu model, ajan tabanlı yürütme, kodlama ve uzun vadeli görevlerde ölçekli olarak sürekli en üst düzeyde performans sunar.

Bu kılavuzda, Gemini 3.5 Flash ile ilgili iyileştirmeler, API değişiklikleri ve taşıma yönergeleri hakkında genel bilgiler yer almaktadır.

Yeni model

Model	Model Kimliği	Açıklama
Gemini 3.5 Flash	`gemini-3.5-flash`	Ajan tabanlı ve kodlama görevlerinde sürekli olarak en iyi performansı sunan en akıllı modelimiz.

Gemini 3.5 Flash, 1 milyon parçalık bağlam penceresini, 65 bin maksimum çıkış parçası sayısını, düşünme özelliğini ve Gemini 3 Flash ile aynı araç ve platform özelliklerini destekler. Bilgisayar Kullanımı şu anda desteklenmemektedir.

Tüm özellikler için modellere genel bakış başlıklı makaleyi inceleyin. Fiyatlandırma için fiyatlandırma sayfasına bakın.

Hızlı başlangıç kılavuzu

Bu kılavuzdaki tüm örneklerde Etkileşimler API'si kullanılmaktadır. Aynı yapılandırma seçenekleri ve öneriler geçerli olmak üzere GenerateContent API de desteklenir.

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Explain how parallel agentic execution works in three sentences."
)
print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

async function main() {
  const interaction = await client.interactions.create({
    model: "gemini-3.5-flash",
    input: "Explain how parallel agentic execution works in three sentences.",
  });
  console.log(interaction.output_text);
}

main();

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Explain how parallel agentic execution works in three sentences."
  }'

Yenilikler

Sürekli olarak en üst düzey performans: En akıllı Flash modelimiz, büyük ölçekte ajan ve kodlama görevleri için optimize edilmiştir.
Ajan benzeri yürütme: Alt ajan dağıtımı, sorun çözme ve büyük ölçekte hızlı ajan benzeri döngüler.
Kodlama: Alternatif yolları test etmek ve çözümleri dinamik olarak keşfetmek için yinelemeli kodlama döngüleri, hızlı keşif ve prototip oluşturma.
Uzun vadeli: Çok adımlı iş akışları ve araçların büyük ölçekte kullanımı.
Düşünce koruma: Model, çok turlu sohbetlerde ara muhakemeyi otomatik olarak korur. API'de değişiklik yapılması gerekmez.
Yeni varsayılan çaba düzeyi: Varsayılan düşünme çabası high değerinden medium değerine değiştirildi. Ayrıntılar için Yeni varsayılan çaba düzeyi başlıklı makaleyi inceleyin.
Geliştirilmiş low düşünme: low, artık daha az adım gerektiren kod ve aracı görevleri için önemli ölçüde geliştirildi. Daha düşük gecikme süresi ve maliyetle yüksek kalite sunuyor.
GA sürümü: Ölçeklendirilmiş üretim kullanımı için kararlı model.

Davranış değişiklikleri

Yeni varsayılan çaba düzeyi: `medium`

Varsayılan düşünme çabası, Gemini 3 Flash önizlemesindeki high'ten medium'ye değiştirildi. medium daha hızlı ve daha uygun maliyetli olmasının yanı sıra çok çeşitli görevlerde çok iyi sonuçlar verir. Karmaşık sorunlarda high modelin daha derinlemesine düşünmesini sağlar.

Çaba düzeyi	Ne zaman kullanılır?
`minimal`	Yanıt hızı için optimize edilmiştir. Sohbet benzeri kullanım alanları, hızlı bilgi yanıtları, daha basit araç çağrıları.
`low`	Daha düşük gecikme süresi ve daha az adım gerektiren kodlama ve yapay zeka görevleri. Biraz düşünmeyi gerektiren analiz ve yazma görevleri için de uygundur.
`medium` (varsayılan)	Çoğu görev için en iyi kalite. Karmaşık kod ve aracı kullanım alanları için önerilir.
`high`	Modelin düşünme ve araç kullanma becerisini en üst düzeye çıkarır. Karmaşık akıl yürütme, zor matematik ve en zor kod ya da aracı görevleri için idealdir. Genişletilmiş düşüncelere ve işlev çağrılarına olanak tanır.

Varsayılanı geçersiz kılmak için yapılandırmanızda thinking_level değerini ayarlayın:

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Prove that the square root of 2 is irrational.",
    generation_config={"thinking_level": "high"},
)
print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({});

async function main() {
  const interaction = await client.interactions.create({
    model: "gemini-3.5-flash",
    input: "Prove that the square root of 2 is irrational.",
    generationConfig: { thinkingLevel: "high" },
  });
  console.log(interaction.output_text);
}

main();

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Prove that the square root of 2 is irrational.",
    "generation_config": {"thinking_level": "high"}
  }'

Düşünceleri koruma

Model, çok adımlı sohbetlerdeki ara muhakemeyi otomatik olarak korur. Sohbet geçmişinde yer aldığında akıl yürütme bağlamı devam eder. Bu da yinelemeli hata ayıklama ve kod yeniden düzenleme gibi karmaşık çok adımlı görevlerde performansı artırır. API'de değişiklik yapılması gerekmez:

Interactions API: Düşünceler otomatik olarak korunur. Davranışta değişiklik yok.
GenerateContent API: Gemini 3.5 Flash'tan itibaren model, görüşme geçmişinde düşünce imzaları varsa önceki tüm aşamalardaki akıl yürütme bağlamını kullanır. Bunu etkinleştirmek için contents içinde tam ve değiştirilmemiş sohbet geçmişini (düşünce imzaları dahil) iletin. SDK'lar bunu otomatik olarak yapar.

Gemini 3.x'teki parametre güncellemeleri ve en iyi uygulamalar

Gemini 3.5 Flash dahil olmak üzere tüm Gemini 3.x modelleri için aşağıdakiler geçerlidir.

temperature, top_p, top_k: Varsayılan değerlerin değiştirilmemesini önemle tavsiye ederiz. Gemini 3'ün akıl yürütme özellikleri, varsayılan ayarlar için optimize edilmiştir.
thinking_budget yerine thinking_level kullanın.
İşlev çağrısı yanıtı eşleştirme: id, name ve yanıt sayısı önceki çağrılarla eşleşmelidir.
Çok formatlı işlev yanıtları: Çok formatlı içerik, işlev yanıtının dışında değil içinde yer almalıdır.
İşlev yanıtlarındaki satır içi talimatlar: Ayrı parçalar olarak değil, işlev yanıtı metnine eklenir.
Gereksiz araç çağrılarını azaltma: Düşünme seviyelerini düşürün veya sistem talimatlarıyla denemeler yaparak aracılı iş akışlarındaki araç çağrılarını azaltın.

Kodunuzu nasıl güncelleyeceğinizi öğrenmek için aşağıdaki bölümlere bakın.

Örnekleme parametreleri (artık önerilmemektedir)

temperature, top_p ve top_k artık tüm Gemini 3.x modelleri için önerilmiyor. Gemini 3'ün muhakeme özellikleri, varsayılan ayarlar için optimize edilmiştir. Bu parametreleri tüm isteklerden kaldırın.

# ⚠️ Remove these parameters (not recommended)
generation_config = {
    "temperature": 0.7,
    "top_p": 0.9,
    "top_k": 40,
}

Belirlenimi sağlamak için belirli kullanım alanınızla ilgili açık kurallar içeren bir sistem talimatı tanımlamanızı öneririz.

`thinking_budget` (artık önerilmiyor)

Ham sayısal thinking_budget parametresinin tüm Gemini 3.x modellerinde kullanılması artık önerilmiyor. Bunun yerine thinking_level dize numarasını kullanın.

# ⚠️ Before (not recommended)
generation_config = {
    "thinking": {"thinking_budget": 7500},
}

# ✅ After
generation_config = {
    "thinking": {"thinking_level": "medium"},
}

Kullanılabilir değerler: minimal, low, medium (varsayılan) ve high.

İşlev çağırma: katı yanıt eşleştirme

Etkileşimler API'si, eşleşmeyen işlev yanıtları için zaten hata veriyor. GenerateContent API henüz hata vermiyor ancak eşleşmeyen yanıtlar, modelin çoğu durumda finish_reason: STOP ile boş yanıtlar döndürmesine neden oluyor. Her zaman aşağıdaki kurallara uyun:

Gereksinim	Ayrıntılar
`id` içerir	Her `FunctionResponse`, ilgili `FunctionCall` öğesindeki `id` öğesini içermelidir.
`name`. maç	Yanıtın `name` değeri, görüşmedeki `name` değeriyle eşleşmelidir.
Eşleşme sayıları	Alınan her `FunctionCall` için tam olarak bir `FunctionResponse` döndürün.

Python

# ✅ Include matching call_id and name in the function_result
final_interaction = client.interactions.create(
    model="gemini-3.5-flash",
    previous_interaction_id=interaction.id,
    tools=[my_tool],
    input=[{
        "type": "function_result",
        "name": fc_step.name,
        "call_id": fc_step.id,
        "result": [{"type": "text", "text": json.dumps(result)}],
    }],
)

JavaScript

// ✅ Include matching call_id and name in the function_result
const finalInteraction = await client.interactions.create({
  model: "gemini-3.5-flash",
  previousInteractionId: interaction.id,
  tools: [myTool],
  input: [{
    type: "function_result",
    name: fcStep.name,
    call_id: fcStep.id,
    result: [{ type: "text", text: JSON.stringify(result) }],
  }],
});

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "model": "gemini-3.5-flash",
    "previous_interaction_id": "<INTERACTION_ID>",
    "tools": [...],
    "input": [{
      "type": "function_result",
      "name": "my_function",
      "call_id": "<CALL_ID>",
      "result": [{"type": "text", "text": "..."}]
    }]
  }'

Çok formatlı işlev yanıtları

Müşterilerin genellikle işlev yanıtı dışında resimler sağladığını görüyoruz. Bu durum, beklenmedik model davranışlarına (ör. düşünce sızıntısı) ve daha düşük kaliteli çıktılara yol açabilir. Bunun yerine Multimodal Function Responses API dokümanlarındaki öneriyi uygulayın ve modele gönderdiğiniz işlev yanıtı bölümlerine çok formatlı içerik ekleyin. Model, daha bilinçli bir yanıt üretmek için bu çok formatlı içeriği bir sonraki adımda işleyebilir.

Python

# ✅ Include multimodal content in the function response
final_interaction = client.interactions.create(
    model="gemini-3.5-flash",
    previous_interaction_id=interaction.id,
    input=[
        {
            "type": "function_result",
            "name": tool_call.name,
            "call_id": tool_call.id,
            "result": [
                {"type": "text", "text": "instrument.jpg"},
                {
                    "type": "image",
                    "mime_type": "image/jpeg",
                    "data": base64_image_data,
                },
            ],
        }
    ],
)

JavaScript

// ✅ Include multimodal content in the function response
const finalInteraction = await client.interactions.create({
  model: "gemini-3.5-flash",
  previousInteractionId: interaction.id,
  input: [{
    type: "function_result",
    name: toolCall.name,
    call_id: toolCall.id,
    result: [
      { type: "text", text: "instrument.jpg" },
      {
        type: "image",
        mime_type: "image/jpeg",
        data: base64ImageData,
      },
    ],
  }],
});

İşlev yanıtlarında satır içi talimatlar

Müşterilerin, işlev yanıtlarıyla birlikte ek talimatlar sağladığını sıklıkla görüyoruz sonraki Parts. Bu durum, modelin beklenmedik şekilde davranmasına (ör. düşünce sızıntısı) ve daha düşük kaliteli çıkışlar üretmesine neden olabilir. Bunun yerine, ek talimatları iki yeni satırla ayrılmış şekilde işlev yanıtı metninin sonuna ekleyin.

Python

# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"

final_interaction = client.interactions.create(
    model="gemini-3.5-flash",
    previous_interaction_id=interaction.id,
    tools=[my_tool],
    input=[{
        "type": "function_result",
        "name": fc_step.name,
        "call_id": fc_step.id,
        "result": [{"type": "text", "text": result_text}],
    }],
)

JavaScript

// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;

const finalInteraction = await client.interactions.create({
  model: "gemini-3.5-flash",
  previousInteractionId: interaction.id,
  tools: [myTool],
  input: [{
    type: "function_result",
    name: fcStep.name,
    call_id: fcStep.id,
    result: [{ type: "text", text: resultText }],
  }],
});

Gereksiz araç çağrılarını azaltma

Araç çağrılarını aşırı kullanma sorunu yaşıyorsanız bu sorunu en aza indirmenize yardımcı olacak iki teknik vardır:

Düşünme düzeyini azaltarak başlayın (medium, low veya minimal): Daha yüksek düşünme düzeyleri, modelin keşfetmek ve doğrulamak için daha fazla araç kullanmasını teşvik eder. Bu nedenle, düzeyi düşürmek araç çağrılarını azaltabilir.
Sistem talimatı ekleyin: Düşünme düzeyi ayarlandıktan sonra aşırı kullanım devam ederse araç kullanımını kısıtlayan bir istem kullanmayı deneyin. Örneğin:
```
You have a limited action budget of <n> tool calls. Use them efficiently.
```

Taşıma kontrol listesi

google-genai SDK'nın 2.0.0 veya sonraki bir sürümüne güncellemenizi önemle tavsiye ederiz. Bu sürümde, Interactions API'de uyumluluğu bozan değişiklikler yapılmıştır. Ayrıntılar için API'de yapılan ve geriye dönük uyumluluğu bozan değişikliklerle ilgili taşıma kılavuzuna bakın.

Gemini 3 Flash önizlemesinden taşıma

Model adını güncelleme: gemini-3-flash-preview → gemini-3.5-flash
Fiyatlandırmayı inceleyin. Gemini 3.5 Flash, Gemini 3 Flash Önizleme sürümünden daha pahalıdır. Ayrıntılar için fiyatlandırma sayfasına göz atın.
temperature, top_p, top_k öğelerini yapılandırmanızdan kaldırın (artık önerilmemektedir).
thinking_budget yerine thinking_level koyun.
Tüm FunctionResponse bölümlerine id ve eşleşen name değerlerini ekleyin.
İstemlerinizi test edin. Varsayılan çaba high → medium olarak değiştirildi. Kaliteyi, hızı ve maliyeti doğrulayın.
Düşünce koruma özelliği artık varsayılan olarak etkindir. Muhakeme bağlamı, dönüşümler arasında aktarılır. Bu durum performansı artırır ancak jeton kullanımını yükseltebilir.
Gereksiz araç çağrılarını azaltın: Düşünme düzeyini azaltarak başlayın (medium, low veya minimal). Aşırı kullanım devam ederse araç kullanımını kısıtlamak için bir sistem talimatı ekleyin.
Bilgisayar Kullanımı şu anda Gemini 3.5 Flash'te desteklenmemektedir. Bilgisayar Kullanımı iş yükleri için Gemini 3 Flash Preview'u kullanmaya devam edin.

Gemini 2.5'ten taşıma

Yukarıdakilerin tümüne ek olarak:

İstemleri basitleştirin. Muhakeme yapmayı zorlamak için zincirleme düşünce istem mühendisliği kullandıysanız bunun yerine daha basit istemlerle thinking_level: "medium" veya "high"'yi deneyin.
PDF ve medya iş yüklerini test edin. Yoğun doküman ayrıştırma için belirli bir davranışa güveniyorsanız doğruluğun devamlılığını sağlamak üzere media_resolution_high ayarını test edin. Varsayılan olarak Gemini 3'e geçiş yapmak, PDF'lerde jeton kullanımını artırabilir ancak videolarda azaltabilir. İstekler bağlam penceresini aşarsa media_resolution değerini açıkça azaltın. Ayrıntılar için medya çözünürlüğü belgelerine bakın.
Araçları birlikte kullanmaktan yararlanın. Google Arama, URL bağlamı, kod yürütme ve özel işlevler aynı istekte kullanılabilir.
Çok formatlı işlev yanıtları kullanıyorsanız çok formatlı içeriği işlev yanıtı bölümlerinin içine taşıyın, yanına değil.
İşlev yanıtlarıyla satır içi talimatlar kullanılıyorsa bunları ayrı parçalar olarak değil, iki yeni satırla ayrılmış şekilde işlev yanıtı metnine ekleyin.
Görüntü segmentasyonu, Gemini 3.x'te desteklenmez. Segmentasyon iş yükleri için düşünme özelliği devre dışı bırakılmış Gemini 2.5 Flash'ı veya Gemini Robotics-ER 1.6'yı kullanmaya devam edin.

Gemini 3 ailesinin özellikleri

Gemini 3.5 Flash, Bilgisayar Kullanımı hariç tüm Gemini 3 ailesi özelliklerini devralır. Gemini 3'te kullanıma sunulan ve devam eden özellikler:

Düşünme: Şifrelenmiş API çağrıları arasında akıl yürütme bağlamı korunur. Etkileşimler API'sinde otomatik, GenerateContent'te ise örtülü.
Araçlarla yapılandırılmış çıkışlar: JSON modunu yerleşik araçlarla (arama, URL bağlamı, kod yürütme, işlev çağrısı) birleştirin.
Çok formatlı işlev yanıtları: İşlev çağrısı sonuçlarında resim, ses ve diğer medya türlerini döndürün.
Görüntülerle kod yürütme: Görüntüleri işleyen ve oluşturan kodları yürütün.
Birleşik araç kullanımı: Yerleşik araçları ve özel işlev çağrılarını aynı istekte kullanın.

Sonraki adımlar

Gemini 3 ailesi hakkında daha fazla bilgiyi Gemini 3 geliştirici kılavuzunda bulabilirsiniz.
İstem mühendisliği kılavuzundan istem tasarımı stratejileri hakkında daha fazla bilgi edinin.
Gemini 3 Cookbook'u kullanmaya başlayın
Gemini API optimizasyonu ve çıkarımı hakkında bilgi edinin.

Gemini 3.5 Flash'teki yenilikler

Yeni model

Hızlı başlangıç kılavuzu

Python

JavaScript

REST

Yenilikler

Davranış değişiklikleri

Yeni varsayılan çaba düzeyi: medium

Python

JavaScript

REST

Düşünceleri koruma

Gemini 3.x'teki parametre güncellemeleri ve en iyi uygulamalar

Örnekleme parametreleri (artık önerilmemektedir)

thinking_budget (artık önerilmiyor)

İşlev çağırma: katı yanıt eşleştirme

Python

JavaScript

REST

Çok formatlı işlev yanıtları

Python

JavaScript

İşlev yanıtlarında satır içi talimatlar

Python

JavaScript

Gereksiz araç çağrılarını azaltma

Taşıma kontrol listesi

Gemini 3 Flash önizlemesinden taşıma

Gemini 2.5'ten taşıma

Gemini 3 ailesinin özellikleri

Sonraki adımlar

Yeni varsayılan çaba düzeyi: `medium`

`thinking_budget` (artık önerilmiyor)