Përdorimi i mjeteve me Gemini API

Mjetet zgjerojnë aftësitë e modeleve Gemini, duke i mundësuar ato të ndërmarrin veprime në botë, të qasen në informacion në kohë reale dhe të kryejnë detyra komplekse llogaritëse. Modelet mund të përdorin mjete si në ndërveprimet standarde kërkesë-përgjigje ashtu edhe në seancat e transmetimit në kohë reale përmes Live API .

API-ja Gemini ofron një sërë mjetesh të integruara dhe të menaxhuara plotësisht, të optimizuara për modelet Gemini ose mund të përcaktoni mjete të personalizuara duke përdorur Thirrjen e Funksioneve .

Mjete të integruara në dispozicion

Mjet Përshkrimi Rastet e përdorimit
Kërkimi në Google Reagime tokësore ndaj ngjarjeve dhe fakteve aktuale nga interneti për të zvogëluar halucinacionet. - Duke iu përgjigjur pyetjeve në lidhje me ngjarjet e fundit
- Verifikimi i fakteve me burime të ndryshme
Hartat e Google-it Ndërtoni asistentë të vetëdijshëm për vendndodhjen që mund të gjejnë vende, të marrin udhëzime dhe të ofrojnë kontekst të pasur lokal. - Planifikimi i itinerareve të udhëtimit me ndalesa të shumta
- Gjetja e bizneseve lokale bazuar në kriteret e përdoruesit
Ekzekutimi i Kodit Lejoni modelin të shkruajë dhe ekzekutojë kod Python për të zgjidhur probleme matematikore ose për të përpunuar të dhënat me saktësi. - Zgjidhja e ekuacioneve komplekse matematikore
- Përpunimi dhe analizimi i saktë i të dhënave tekstuale
Konteksti i URL-së Drejtojeni modelin të lexojë dhe analizojë përmbajtjen nga faqe interneti ose dokumente specifike. - Përgjigjet në pyetje bazuar në URL ose dokumente specifike
- Marrja e informacionit nëpër faqe të ndryshme interneti
Përdorimi i kompjuterit (Paraparje) Aktivizoni Gemini-n për të parë një ekran dhe për të gjeneruar veprime për të bashkëvepruar me ndërfaqet e përdoruesit të shfletuesit të internetit (ekzekutimi nga ana e klientit). - Automatizimi i rrjedhave të punës përsëritëse të bazuara në internet
- Testimi i ndërfaqeve të përdoruesit të aplikacioneve web
Kërkimi i skedarëve Indeksoni dhe kërkoni dokumentet tuaja për të aktivizuar Gjenerimin e Shtuar të Rikthimit (RAG). - Duke kërkuar manuale teknike
- Përgjigje pyetjesh mbi të dhënat pronësore

Shihni faqen e Çmimeve për detaje mbi kostot që lidhen me mjete specifike.

Si funksionon ekzekutimi i mjeteve

Mjetet i lejojnë modelit të kërkojë veprime gjatë një bisede. Rrjedha ndryshon në varësi të faktit nëse mjeti është i integruar (i menaxhuar nga Google) apo i personalizuar (i menaxhuar nga ju).

Fluksi i integruar i mjeteve

Për mjetet e integruara si Google Search ose Code Execution, i gjithë procesi ndodh brenda një thirrjeje API:

  1. Ju dërgoni një pyetje: "Cila është rrënja katrore e çmimit të fundit të aksioneve të GOOG?"
  2. Gemini vendos se i duhen mjete dhe i ekzekuton ato në serverat e Google (p.sh., kërkon çmimin e aksioneve, pastaj ekzekuton kodin Python për të llogaritur rrënjën katrore).
  3. Gemini kthen përgjigjen përfundimtare të bazuar në rezultatet e mjetit.

Rrjedha e mjeteve të personalizuara (Thirrja e funksionit)

Për mjetet e personalizuara dhe përdorimin e kompjuterit, aplikacioni juaj merret me ekzekutimin:

  1. Ju dërgoni një kërkesë së bashku me deklaratat e funksioneve (mjeteve).
  2. Gemini mund të dërgojë mbrapsht një JSON të strukturuar për të thirrur një funksion specifik (për shembull, {"name": "get_order_status", "args": {"order_id": "123"}} ).
  3. Ju e ekzekutoni funksionin në aplikacionin ose mjedisin tuaj.
  4. Ju i dërgoni rezultatet e funksionit përsëri te Gemini.
  5. Gemini përdor rezultatet për të gjeneruar një përgjigje përfundimtare ose një thirrje tjetër mjeti.

Mësoni më shumë në udhëzuesin e thirrjes së funksioneve .

Daljet e strukturuara kundrejt Thirrjes së Funksionit

Gemini ofron dy metoda për gjenerimin e rezultateve të strukturuara. Përdorni Thirrjen e Funksionit kur modeli duhet të kryejë një hap të ndërmjetëm duke u lidhur me mjetet ose sistemet tuaja të të dhënave. Përdorni Daljet e Strukturuara kur keni nevojë që përgjigja përfundimtare e modelit t'i përmbahet një skeme specifike, siç është për paraqitjen e një UI të personalizuar.

Agjentë ndërtimi

Agjentët janë sisteme që përdorin modele dhe mjete për të përfunduar detyra me shumë hapa. Ndërsa Gemini ofron aftësitë e arsyetimit ("truri") dhe mjetet thelbësore ("duart"), shpesh ju nevojitet një strukturë orkestrimi për të menaxhuar kujtesën e agjentit, për të planifikuar cikle dhe për të kryer zinxhir mjetesh komplekse.

Gemini integrohet me kornizat kryesore të agjentëve me burim të hapur:

  • LangChain / LangGraph : Ndërtoni rrjedha aplikacionesh komplekse dhe me gjendje gjendjeje dhe sisteme me shumë agjentë duke përdorur struktura grafike.
  • LlamaIndex : Lidhni agjentët e Gemini me të dhënat tuaja private për rrjedha pune të përmirësuara nga RAG.
  • CrewAI : Orkestro agjentë autonomë të IA-së bashkëpunues dhe që luajnë role.
  • Vercel AI SDK : Ndërtoni ndërfaqe përdoruesi dhe agjentë të mundësuar nga IA në JavaScript/TypeScript.
  • Google ADK : Një kornizë me burim të hapur për ndërtimin dhe orkestrimin e agjentëve të ndërveprueshëm të IA-së.