Mjetet zgjerojnë aftësitë e modeleve Gemini, duke i mundësuar ato të ndërmarrin veprime në botë, të qasen në informacion në kohë reale dhe të kryejnë detyra komplekse llogaritëse. Modelet mund të përdorin mjete si në ndërveprimet standarde kërkesë-përgjigje ashtu edhe në seancat e transmetimit në kohë reale përmes Live API .
API-ja Gemini ofron një sërë mjetesh të integruara dhe të menaxhuara plotësisht, të optimizuara për modelet Gemini ose mund të përcaktoni mjete të personalizuara duke përdorur Thirrjen e Funksioneve .
Mjete të integruara në dispozicion
| Mjet | Përshkrimi | Rastet e përdorimit |
|---|---|---|
| Kërkimi në Google | Reagime tokësore ndaj ngjarjeve dhe fakteve aktuale nga interneti për të zvogëluar halucinacionet. | - Duke iu përgjigjur pyetjeve në lidhje me ngjarjet e fundit - Verifikimi i fakteve me burime të ndryshme |
| Hartat e Google-it | Ndërtoni asistentë të vetëdijshëm për vendndodhjen që mund të gjejnë vende, të marrin udhëzime dhe të ofrojnë kontekst të pasur lokal. | - Planifikimi i itinerareve të udhëtimit me ndalesa të shumta - Gjetja e bizneseve lokale bazuar në kriteret e përdoruesit |
| Ekzekutimi i Kodit | Lejoni modelin të shkruajë dhe ekzekutojë kod Python për të zgjidhur probleme matematikore ose për të përpunuar të dhënat me saktësi. | - Zgjidhja e ekuacioneve komplekse matematikore - Përpunimi dhe analizimi i saktë i të dhënave tekstuale |
| Konteksti i URL-së | Drejtojeni modelin të lexojë dhe analizojë përmbajtjen nga faqe interneti ose dokumente specifike. | - Përgjigjet në pyetje bazuar në URL ose dokumente specifike - Marrja e informacionit nëpër faqe të ndryshme interneti |
| Përdorimi i kompjuterit (Paraparje) | Aktivizoni Gemini-n për të parë një ekran dhe për të gjeneruar veprime për të bashkëvepruar me ndërfaqet e përdoruesit të shfletuesit të internetit (ekzekutimi nga ana e klientit). | - Automatizimi i rrjedhave të punës përsëritëse të bazuara në internet - Testimi i ndërfaqeve të përdoruesit të aplikacioneve web |
| Kërkimi i skedarëve | Indeksoni dhe kërkoni dokumentet tuaja për të aktivizuar Gjenerimin e Shtuar të Rikthimit (RAG). | - Duke kërkuar manuale teknike - Përgjigje pyetjesh mbi të dhënat pronësore |
Shihni faqen e Çmimeve për detaje mbi kostot që lidhen me mjete specifike.
Si funksionon ekzekutimi i mjeteve
Mjetet i lejojnë modelit të kërkojë veprime gjatë një bisede. Rrjedha ndryshon në varësi të faktit nëse mjeti është i integruar (i menaxhuar nga Google) apo i personalizuar (i menaxhuar nga ju).
Fluksi i integruar i mjeteve
Për mjetet e integruara si Google Search ose Code Execution, i gjithë procesi ndodh brenda një thirrjeje API:
- Ju dërgoni një pyetje: "Cila është rrënja katrore e çmimit të fundit të aksioneve të GOOG?"
- Gemini vendos se i duhen mjete dhe i ekzekuton ato në serverat e Google (p.sh., kërkon çmimin e aksioneve, pastaj ekzekuton kodin Python për të llogaritur rrënjën katrore).
- Gemini kthen përgjigjen përfundimtare të bazuar në rezultatet e mjetit.
Rrjedha e mjeteve të personalizuara (Thirrja e funksionit)
Për mjetet e personalizuara dhe përdorimin e kompjuterit, aplikacioni juaj merret me ekzekutimin:
- Ju dërgoni një kërkesë së bashku me deklaratat e funksioneve (mjeteve).
- Gemini mund të dërgojë mbrapsht një JSON të strukturuar për të thirrur një funksion specifik (për shembull,
{"name": "get_order_status", "args": {"order_id": "123"}}). - Ju e ekzekutoni funksionin në aplikacionin ose mjedisin tuaj.
- Ju i dërgoni rezultatet e funksionit përsëri te Gemini.
- Gemini përdor rezultatet për të gjeneruar një përgjigje përfundimtare ose një thirrje tjetër mjeti.
Mësoni më shumë në udhëzuesin e thirrjes së funksioneve .
Daljet e strukturuara kundrejt Thirrjes së Funksionit
Gemini ofron dy metoda për gjenerimin e rezultateve të strukturuara. Përdorni Thirrjen e Funksionit kur modeli duhet të kryejë një hap të ndërmjetëm duke u lidhur me mjetet ose sistemet tuaja të të dhënave. Përdorni Daljet e Strukturuara kur keni nevojë që përgjigja përfundimtare e modelit t'i përmbahet një skeme specifike, siç është për paraqitjen e një UI të personalizuar.
Agjentë ndërtimi
Agjentët janë sisteme që përdorin modele dhe mjete për të përfunduar detyra me shumë hapa. Ndërsa Gemini ofron aftësitë e arsyetimit ("truri") dhe mjetet thelbësore ("duart"), shpesh ju nevojitet një strukturë orkestrimi për të menaxhuar kujtesën e agjentit, për të planifikuar cikle dhe për të kryer zinxhir mjetesh komplekse.
Gemini integrohet me kornizat kryesore të agjentëve me burim të hapur:
- LangChain / LangGraph : Ndërtoni rrjedha aplikacionesh komplekse dhe me gjendje gjendjeje dhe sisteme me shumë agjentë duke përdorur struktura grafike.
- LlamaIndex : Lidhni agjentët e Gemini me të dhënat tuaja private për rrjedha pune të përmirësuara nga RAG.
- CrewAI : Orkestro agjentë autonomë të IA-së bashkëpunues dhe që luajnë role.
- Vercel AI SDK : Ndërtoni ndërfaqe përdoruesi dhe agjentë të mundësuar nga IA në JavaScript/TypeScript.
- Google ADK : Një kornizë me burim të hapur për ndërtimin dhe orkestrimin e agjentëve të ndërveprueshëm të IA-së.