12 DHJETOR 2025
Ava: Ndërtimi i rrjedhave të punës agjentike me Gemini 2.5 Flash dhe Live API

Ava është një “sistem operativ familjar i mundësuar nga inteligjenca artificiale” i projektuar për të menaxhuar logjistikën e jetës familjare duke parashikuar nevojat dhe duke automatizuar detyrat.
Informacioni që prindërit menaxhojnë rrallë është i strukturuar; ai vjen nëpërmjet emaileve të paqëndrueshme të shkollës, pamjeve të ekranit të fletushkave, bashkëngjitjeve në PDF, temave të gjata në WhatsApp dhe shënimeve zanore. Ava duhet ta kuptojë kontekstin dhe të bashkëveprojë pa probleme me shërbimet e jashtme.
Për të trajtuar të dhënat e çrregullta dhe të pastrukturuara të botës reale, ekipi i Ava zbatoi një arkitekturë me nivele duke përdorur modelet Gemini 2.5 Flash për faza të ndryshme të tubacionit të tyre agjentik dhe Live API për të ofruar një ndërfaqe bisedore.

Optimizimi i performancës dhe efikasitetit
Kërkesat hyrëse së pari hasin një router agjentësh të lehtë për ta bërë përvojën e përdoruesit të ndihet reaguese. Ky router vepron si sistem triazhimi, duke klasifikuar përparësinë e të dhënave hyrëse, duke nxjerrë vendet e çelësave (kush, kur, ku) dhe duke vendosur se cili mjet i specializuar ose model pasues kërkohet.
Sipas Joe Alicata, bashkëthemelues dhe drejtor teknologjik i Ava, “Gemini 2.5 Flash-Lite shkëlqen për kontrolle ultra të lehta”, duke trajtuar zbulimin e qëllimit dhe përmbledhjen në formë të shkurtër, ndërkohë që ofron përgjigje që zgjasin më pak se një sekondë.
Trajtimi i planifikimit dhe ekzekutimit kompleks
Pasi të përcaktohet qëllimi, detyrat shpesh kërkojnë arsyetim më të thellë. Për shembull, analizimi i një kalendari shkollor, normalizimi i datave të papajtueshme dhe propozimi i ngjarjes së saktë kërkon një kuptim të nuancuar. Gemini 2.5 Flash i mundëson Ava-s të shërbejë si një "drejtoreshë operacionale" e aftë shtëpiake duke përmbushur kërkesa të sakta teknike:
- Kuptimi multimodal : Përpunimi i tekstit, imazheve dhe audios në një kalim të vetëm
- Saktësi e shtuar në kushte paqartësie : Interpretimi i saktë i komunikimeve të paqëndrueshme shkollore
- Thirrje e besueshme e funksioneve : Sigurimi që veprimet, të tilla si thirrja e Gmail dhe API-t të Kalendarit, përdorin të dhëna të strukturuara dhe të besueshme.
Familjet mund t'i menaxhojnë detyrat e tyre shtëpiake tërësisht përmes ndërveprimeve zanore të mundësuara nga Live API. Alicata vuri në dukje se ata kishin një "kërkesë të fortë rreth audios native", kështu që Ava ndihet si një mjet natyror për t'u shfrytëzuar.
Një qasje e pjekur për ndërtimin e sistemeve agjentike
Ekipi përdori gjerësisht Google AI Studio gjatë zhvillimit për të përsëritur me shpejtësi skemat e kërkesave dhe mjeteve, si dhe modelet kandidate për testim A/B, duke e shkurtuar ciklin nga ideja në testim nga ditë në orë.
Rezultatet demonstruan efikasitetin e qasjes së tyre me shumë modele. Ata vunë re saktësi më të lartë në fazën e parë të të dhënave të zhurmshme, si temat e email-eve dhe fotot e fletëpalosjeve. Gjatë sprintit alfa, 80% e përdoruesve të Ava ishin përdorues aktivë çdo ditë dhe mijëra ngjarje të triazhuara u miratuan dhe u shtuan në kalendarë.
Duke përdorur modele shumë efikase për lexim të shpejtë dhe duke rezervuar modele që kërkojnë më shumë burime për analiza komplekse, sistemet agjentike mund të funksionojnë me shpejtësinë e jetës reale.
Për të eksploruar se si modelet Gemini dhe Live API mund të përmirësojnë rrjedhat e punës së agjentëve, rishikoni dokumentacionin tonë të API-t .
Pikë shiu
Platforma e monitorimit të inteligjencës artificiale e Raindrop përdor Gemini 2.5 Flash për të arritur zbulimin e problemeve në kohë reale, për të ulur ndjeshëm kohën e kërkimit dhe për të ulur kostot me mbi 90%.