Araçlar, Gemini modellerinin yeteneklerini genişleterek dünyada işlem yapmalarını, anlık bilgilere erişmelerini ve karmaşık hesaplama görevlerini gerçekleştirmelerini sağlar. Modeller, hem standart istek-yanıt etkileşimlerinde hem de Live API kullanılarak yapılan gerçek zamanlı akış oturumlarında araçları kullanabilir.
Araçlar, bir modelin sorgulara yanıt vermek için kullanabileceği belirli özelliklerdir (ör. Google Arama veya Kod Yürütme). Gemini API, tümüyle yönetilen bir dizi yerleşik araç sunar. Dilerseniz Function Calling'i kullanarak özel araçlar da tanımlayabilirsiniz.
Çok adımlı, hedefe yönelik sistemler oluşturmak için Agents Overview (Temsilcilere Genel Bakış) başlıklı makaleyi inceleyin.
Kullanılabilir yerleşik araçlar
| Araç | Açıklama | Kullanım Alanları |
|---|---|---|
| Google Arama | Halüsinasyonları azaltmak için yanıtları web'deki güncel olaylara ve bilgilere dayandırın. | \- Son olaylarla ilgili soruları yanıtlama - Çeşitli kaynaklardan alınan bilgilerle gerçekleri doğrulama |
| Google Haritalar | Yerleri bulabilen, yol tarifi alabilen ve zengin yerel bağlam bilgileri sağlayabilen konuma duyarlı asistanlar oluşturun. | \- Birden fazla durak içeren seyahat planları yapma - Kullanıcı ölçütlerine göre yerel işletmeleri bulma |
| Kod Yürütme | Modelin matematik problemlerini çözmek veya verileri doğru şekilde işlemek için Python kodu yazmasına ve çalıştırmasına izin verin. | - Karmaşık matematiksel denklemleri çözme - Metin verilerini hassas bir şekilde işleme ve analiz etme |
| URL Bağlamı | Modele, belirli web sayfalarındaki veya belgelerdeki içerikleri okuyup analiz etmesini söyleyin. | \- Belirli URL'lere veya belgelere dayalı olarak soruları yanıtlama - Farklı web sayfalarındaki bilgileri alma |
| Bilgisayar Kullanımı (Önizleme) | Gemini'ın ekranı görüntülemesine ve web tarayıcısı kullanıcı arayüzleriyle etkileşim kurmak için işlemler oluşturmasına izin verin (istemci tarafında yürütme). | \- Tekrarlayan web tabanlı iş akışlarını otomatikleştirme - Web uygulaması kullanıcı arayüzlerini test etme |
| Dosya Arama | Veriyle Artırılmış Üretim'i (RAG) etkinleştirmek için kendi dokümanlarınızı dizine ekleyin ve arayın. | - Teknik kılavuzlarda arama yapma - Tescilli verilerle ilgili soruları yanıtlama |
Belirli araçlarla ilişkili maliyetler hakkında ayrıntılı bilgi için Fiyatlandırma sayfasına bakın.
Araç yürütme nasıl çalışır?
Araçlar, modelin sohbet sırasında işlem isteğinde bulunmasına olanak tanır. Akış, aracın yerleşik (Google tarafından yönetilen) veya özel (sizin tarafınızdan yönetilen) olmasına bağlı olarak değişir.
Yerleşik araç akışı
Yerleşik araçlar (Google Arama, Google Haritalar, URL Bağlamı, Dosya Arama, Kod Yürütme) için tüm süreç tek bir API çağrısı içinde gerçekleşir:
- Siz bir istem gönderiyorsunuz: "GOOG'un en son hisse senedi fiyatının karekökü nedir?"
- Gemini, araçlara ihtiyaç duyduğuna karar verir ve bunları Google'ın sunucularında çalıştırır (ör. hisse senedi fiyatını arar, ardından karekökü hesaplamak için Python kodu çalıştırır).
- Gemini, araç sonuçlarına dayalı nihai yanıtı geri gönderir.
Özel araç akışı (işlev çağırma)
Özel araçlar ve bilgisayar kullanımı için yürütme işlemini uygulamanız gerçekleştirir:
- İşlev (araç) bildirimleriyle birlikte istem gönderiyorsanız siz.
- Gemini, belirli bir işlevi (ör.
{"name": "get_order_status", "args": {"order_id": "123"}}) çağırmak için her zaman benzersiz biridile birlikte yapılandırılmış JSON gönderebilir. - İşlevi uygulamanızda veya ortamınızda siz yürütürsünüz.
- İşlev çağrısıyla aynı
idile işlev sonuçlarını siz Gemini'a geri gönderirsiniz. - Gemini, sonuçları kullanarak nihai bir yanıt veya başka bir araç çağrısı oluşturur.
Daha fazla bilgi için İşlev çağrısı kılavuzunu inceleyin.
Yerleşik ve özel araçları birleştirme akışı
Yerleşik araçları ve özel araçları (işlev çağrıları) birleştiren isteklerde model, farklı ortamlarda yürütmeyi koordine etmek için araç bağlamı dolaşımını kullanır:
- Siz bir istem gönderip etkinleştirmek istediğiniz yerleşik araçları ve özel işlevleri tanımlayarak kombinasyon desteğini etkinleştirmek için bir işaret ayarlarsınız.
- Gemini, yerleşik araçları çalıştırır ve herhangi bir istemci tarafı işlev çağrısı oluşturulursa kullanıcıya yanıt verir (önce hangisinin çalıştırılacağı, isteme ve modelin kararına bağlıdır). Aşağıdaki bilgileri içeren bir yanıt gönderir:
- Araç çağrısının onayı
- Araç yanıtının sonuçları (model iki paralel işlev çağrısı oluşturduysa bu, JSON'dan sonra gelebilir)
- İşlevinizi çağırmak için yapılandırılmış JSON
- Bağlamı korumak için şifrelenmiş düşünce imzaları
- İşlevi uygulamanızda veya ortamınızda siz yürütürsünüz.
- Gemini'ın yanıtının tüm bölümlerini ve işlev çağrısı sonuçlarınızı siz döndürürsünüz.
- Gemini, birleştirilmiş tüm bağlamı kullanarak son yanıtı oluşturur.
Yerleşik ve özel araç kombinasyonu desteğini etkinleştirme ve bağlam dolaşımı örnekleri hakkında bilgi edinmek için Araç kombinasyonu kılavuzunu okuyun.
Yapılandırılmış çıkışlar ve işlev çağırma
Gemini, yapılandırılmış çıkışlar oluşturmak için iki yöntem sunar. Modelin kendi araçlarınıza veya veri sistemlerinize bağlanarak ara adım atması gerektiğinde fonksiyon çağrısı özelliğini kullanın. Modelin nihai yanıtının belirli bir şemaya kesinlikle uyması gerektiğinde (ör. özel bir kullanıcı arayüzü oluşturmak için) Yapılandırılmış Çıkışlar'ı kullanın.
Araçlarla yapılandırılmış çıkışlar
Yapılandırılmış Çıkışlar'ı yerleşik araçlarla birleştirerek harici verilere veya hesaplamaya dayalı model yanıtlarının katı bir şemaya uymaya devam etmesini sağlayabilirsiniz.
Kod örnekleri için Araçlarla yapılandırılmış çıkışlar başlıklı makaleye bakın.