Gemini API ile Araçları ve Aracıları Kullanma

Araçlar ve Temsilciler, Gemini modellerinin yeteneklerini genişleterek dünyada işlem yapmalarını, anlık bilgilere erişmelerini ve karmaşık hesaplama görevlerini gerçekleştirmelerini sağlar. Modeller, Live API'yi kullanarak hem standart istek-yanıt etkileşimlerinde hem de gerçek zamanlı akış oturumlarında araçları kullanabilir.

  • Araçlar, bir modelin sorguları yanıtlamak için kullanabileceği belirli özelliklerdir (ör. Google Arama veya Kod Yürütme).
  • Aracı, kullanıcı hedefine ulaşmak için çok adımlı görevleri planlayabilen, yürütebilen ve sentezleyebilen sistemlerdir.

Gemini API, Gemini modelleri için optimize edilmiş, tümüyle yönetilen, yerleşik bir araç ve aracı paketi sunar. Ayrıca Function Calling'i kullanarak özel araçlar da tanımlayabilirsiniz.

Kullanılabilir yerleşik araçlar

Araç Açıklama Kullanım Alanları
Google Arama Halüsinasyonları azaltmak için yanıtları web'deki güncel olaylara ve bilgilere dayandırın. - Son olaylarla ilgili soruları yanıtlama
- Çeşitli kaynaklarla bilgileri doğrulama
Google Haritalar Yerleri bulabilen, yol tarifi alabilen ve zengin yerel bağlam bilgileri sağlayabilen konuma duyarlı asistanlar oluşturun. - Birden fazla durak içeren seyahat planları yapma
- Kullanıcı ölçütlerine göre yerel işletmeleri bulma
Kod Yürütme Modelin matematik problemlerini çözmek veya verileri doğru şekilde işlemek için Python kodu yazmasına ve çalıştırmasına izin verin. Karmaşık matematiksel denklemleri çözme
- Metin verilerini hassas bir şekilde işleme ve analiz etme
URL Bağlamı Modele, belirli web sayfalarındaki veya belgelerdeki içerikleri okuyup analiz etmesini söyleyin. - Belirli URL'lere veya dokümanlara dayalı olarak soruları yanıtlama
- Farklı web sayfalarındaki bilgileri alma
Bilgisayar Kullanımı (Önizleme) Gemini'ın ekranı görüntülemesine ve web tarayıcısı kullanıcı arayüzleriyle etkileşim kurmak için işlemler oluşturmasına izin verin (istemci tarafında yürütme). - Tekrarlanan web tabanlı iş akışlarını otomatikleştirme
- Web uygulaması kullanıcı arayüzlerini test etme
Dosya Arama Veriyle Artırılmış Üretim'i (RAG) etkinleştirmek için kendi dokümanlarınızı dizine ekleyin ve arayın. - Teknik kılavuzlarda arama yapma
- Tescilli verilerle ilgili soruları yanıtlama

Belirli araçlarla ilişkili maliyetler hakkında ayrıntılı bilgi için Fiyatlandırma sayfasına bakın.

Kullanılabilir müşteri temsilcileri

Temsilci Açıklama Kullanım Alanları
Deep Research Çok adımlı araştırma görevlerini bağımsız olarak planlar, yürütür ve sentezler. - Pazar analizi
- Gerekli özen
- Literatür incelemeleri

Araç yürütme nasıl çalışır?

Araçlar, modelin sohbet sırasında işlem isteğinde bulunmasına olanak tanır. Akış, aracın yerleşik (Google tarafından yönetilen) veya özel (sizin tarafınızdan yönetilen) olmasına bağlı olarak değişir.

Yerleşik araç akışı

Yerleşik araçlar (Google Arama, Google Haritalar, URL Bağlamı, Dosya Arama, Kod Yürütme) için tüm süreç tek bir API çağrısı içinde gerçekleşir:

  1. Siz bir istem gönderiyorsunuz: "GOOG'un en son hisse senedi fiyatının karekökü nedir?"
  2. Gemini, araçlara ihtiyaç duyduğuna karar verir ve bunları Google'ın sunucularında çalıştırır (ör. hisse senedi fiyatını arar, ardından karekökü hesaplamak için Python kodu çalıştırır).
  3. Gemini, araç sonuçlarına dayalı nihai yanıtı geri gönderir.

Özel araç akışı (işlev çağırma)

Özel araçlar ve bilgisayar kullanımı için yürütme işlemini uygulamanız gerçekleştirir:

  1. İşlev (araç) bildirimleriyle birlikte istem gönderiyorsanız siz.
  2. Gemini, belirli bir işlevi (ör. {"name": "get_order_status", "args": {"order_id": "123"}}) çağırmak için her zaman benzersiz bir id ile birlikte yapılandırılmış JSON gönderebilir.
  3. İşlevi uygulamanızda veya ortamınızda siz yürütürsünüz.
  4. İşlev çağrısıyla aynı id ile işlev sonuçlarını siz Gemini'a geri gönderirsiniz.
  5. Gemini, sonuçları kullanarak nihai bir yanıt veya başka bir araç çağrısı oluşturur.

Daha fazla bilgi için İşlev çağrısı kılavuzunu inceleyin.

Yerleşik ve özel araçları birleştirme akışı

Yerleşik araçları ve özel araçları (işlev çağrıları) birleştiren isteklerde model, farklı ortamlarda yürütmeyi koordine etmek için araç bağlamı dolaşımını kullanır:

  1. Siz bir istem gönderip etkinleştirmek istediğiniz yerleşik araçları ve özel işlevleri tanımlayarak kombinasyon desteğini etkinleştirmek için bir işaret ayarlarsınız.
  2. Gemini, yerleşik araçları çalıştırır ve herhangi bir istemci tarafı işlev çağrısı oluşturulursa kullanıcıya yanıt verir (önce hangisinin çalıştırılacağı, isteme ve modelin kararına bağlıdır). Aşağıdaki bilgileri içeren bir yanıt gönderir:
    • Araç çağrısının onayı
    • Araç yanıtının sonuçları (model iki paralel işlev çağrısı oluşturduysa bu, JSON'dan sonra gelebilir)
    • İşlevinizi çağırmak için yapılandırılmış JSON
    • Bağlamı korumak için şifrelenmiş düşünce imzaları
  3. İşlevi uygulamanızda veya ortamınızda siz yürütürsünüz.
  4. Gemini'ın yanıtının tüm bölümlerini ve işlev çağrısı sonuçlarınızı siz döndürürsünüz.
  5. Gemini, birleştirilmiş tüm bağlamı kullanarak son yanıtı oluşturur.

Yerleşik ve özel araç kombinasyonu desteğini etkinleştirme ve bağlam dolaşımı örnekleri hakkında bilgi edinmek için Araç kombinasyonu kılavuzunu okuyun.

Yapılandırılmış çıkışlar ve işlev çağırma

Gemini, yapılandırılmış çıkışlar oluşturmak için iki yöntem sunar. Modelin kendi araçlarınıza veya veri sistemlerinize bağlanarak ara adım atması gerektiğinde fonksiyon çağrısı özelliğini kullanın. Modelin nihai yanıtının belirli bir şemaya kesinlikle uyması gerektiğinde (ör. özel bir kullanıcı arayüzü oluşturmak için) Yapılandırılmış Çıkışlar'ı kullanın.

Araçlarla yapılandırılmış çıkışlar

Yapılandırılmış Çıkışlar'ı yerleşik araçlarla birleştirerek harici verilere veya hesaplamaya dayalı model yanıtlarının katı bir şemaya uymaya devam etmesini sağlayabilirsiniz.

Kod örnekleri için Araçlarla yapılandırılmış çıkışlar başlıklı makaleye bakın.

Temsilci oluşturma

Temsilciler, çok adımlı görevleri tamamlamak için modelleri ve araçları kullanan sistemlerdir. Gemini, muhakeme yetenekleri ("beyin") ve temel araçlar ("eller") sunsa da genellikle aracının belleğini yönetmek, plan döngüleri oluşturmak ve karmaşık araç zincirleme işlemleri gerçekleştirmek için bir orkestrasyon çerçevesine ihtiyacınız olur.

Çok adımlı iş akışlarında güvenilirliği en üst düzeye çıkarmak için modelin nasıl akıl yürüteceğini ve planlayacağını açıkça kontrol eden talimatlar oluşturmanız gerekir. Gemini, genel olarak güçlü bir akıl yürütme yeteneği sunsa da karmaşık aracıların, sorunlar karşısında ısrarcı olma, risk değerlendirmesi ve proaktif planlama gibi belirli davranışları zorunlu kılan istemlerden yararlanması gerekir.

Bu istemleri tasarlamayla ilgili stratejiler için Agentic iş akışları bölümüne bakın. Aşağıda, sistem talimatı örneği verilmiştir. Bu talimat, çeşitli aracı ölçütlerinde performansı yaklaşık %5 oranında artırmıştır.

Aracı çerçeveleri

Gemini, aşağıdakiler gibi önde gelen açık kaynaklı aracı çerçeveleriyle entegre olur:

  • LangChain / LangGraph: Grafik yapılarını kullanarak durum bilgisi olan, karmaşık uygulama akışları ve çoklu ajan sistemleri oluşturun.
  • LlamaIndex: RAG ile geliştirilmiş iş akışları için Gemini ajanlarını özel verilerinize bağlayın.
  • CrewAI: Ortak çalışmaya dayalı, rol oynayan otonom yapay zeka temsilcilerini yönetin.
  • Vercel AI SDK: JavaScript/TypeScript'te yapay zeka destekli kullanıcı arayüzleri ve temsilciler oluşturun.
  • Google ADK: Birlikte çalışabilen yapay zeka temsilcileri oluşturmak ve düzenlemek için kullanılan açık kaynaklı bir çerçeve.