12 ARALIK 2025
Ava: Gemini 2.5 Flash ve Live API ile temsilci iş akışları oluşturma
Ava, ihtiyaçları tahmin ederek ve görevleri otomatikleştirerek aile hayatının lojistiğini yönetmek için tasarlanmış "yapay zeka destekli aile işletim sistemidir".
Velilerin yönettiği bilgiler nadiren yapılandırılmış olur. Bu bilgiler; tutarsız okul e-postaları, el ilanlarının ekran görüntüleri, PDF ekleri, uzun WhatsApp yazışmaları ve sesli notlar aracılığıyla gelir. Ava, bağlamı anlamalı ve harici hizmetlerle sorunsuz bir şekilde etkileşim kurmalıdır.
Ava ekibi, gerçek dünyanın karmaşık ve yapılandırılmamış girişlerini işlemek için temsilci işlem hattının farklı aşamalarında Gemini 2.5 Flash modellerini ve sohbet arayüzü sağlamak için Live API'yi kullanan katmanlı bir mimari uyguladı.
Performansı ve verimliliği optimize etme
Gelen istekler, kullanıcı deneyiminin hızlı olmasını sağlamak için önce basit bir aracı yönlendiriciyle karşılaşır. Bu yönlendirici, triyaj sistemi gibi davranarak girişin önceliğini sınıflandırır, önemli yerleri (kim, ne zaman, nerede) ayıklar ve hangi özel aracın veya sonraki modelin gerekli olduğuna karar verir.
Ava'nın kurucu ortağı ve CTO'su Joe Alicata'ya göre "Gemini 2.5 Flash-Lite, ultra hafif kontrollerde öne çıkıyor". Bu model, niyet tespitini ve kısa özetleri işlerken bir saniyeden kısa sürede yanıt veriyor.
Karmaşık planlama ve uygulamayı yönetme
Amaç belirlendikten sonra görevler genellikle daha derin bir muhakeme gerektirir. Örneğin, bir okul takvimini ayrıştırmak, tutarsız tarihleri normalleştirmek ve doğru etkinliği önermek için ayrıntılı bir anlayış gerekir. Gemini 2.5 Flash, Ava'nın titiz teknik gereksinimleri karşılayarak yetenekli bir "ev COO'su" olarak hizmet vermesini sağlar:
- Çok formatlı anlama: Metin, resim ve sesleri tek seferde işleme
- Belirsizlik durumunda doğruluğu artırma: Tutarsız okul iletişimlerini doğru şekilde yorumlama
- Güvenilir işlev çağrısı: Gmail ve Takvim API'sini çağırma gibi işlemlerin yapılandırılmış ve güvenilir veriler kullanmasını sağlama
Aileler, ev işlerini tamamen Live API'nin etkinleştirdiği sesli etkileşimler aracılığıyla yönetebilir. Alicata, "yerel sesle ilgili katı bir gereksinimleri" olduğunu ve bu nedenle Ava'nın kullanılabilecek doğal bir araç olduğunu belirtti.
Temsilci tabanlı sistemler oluşturmaya yönelik olgun bir yaklaşım
Ekip, geliştirme sırasında Google AI Studio'yu yoğun bir şekilde kullanarak istemler ve araç şemaları üzerinde hızlı bir şekilde yineleme yaptı ve aday modelleri A/B testine tabi tuttu. Böylece, fikir aşamasından test aşamasına geçiş süresini günlerden saatlere indirdi.
Sonuçlar, çok modelli yaklaşımlarının etkili olduğunu gösterdi. E-posta yazışmaları ve el ilanı fotoğrafları gibi gürültülü girişlerde daha yüksek ilk geçiş doğruluğu gözlemlediler. Alfa sprinti sırasında Ava kullanıcılarının% 80'i günlük etkin kullanıcıydı ve binlerce triyajlı etkinlik onaylanıp takvimlere eklendi.
Hızlı okuma için yüksek verimli modelleri kullanıp daha fazla kaynak gerektiren modelleri karmaşık analizler için ayırarak, yapay zeka sistemleri gerçek hayatın hızında çalışabilir.
Gemini modellerinin ve Live API'nin, aracı tabanlı iş akışlarını nasıl kolaylaştırabileceğini keşfetmek için API belgelerimizi inceleyin.