Ringkasan Agen

Agen adalah sistem yang memanfaatkan model Gemini, serangkaian alat, dan kemampuan penalaran untuk melakukan tugas kompleks multi-langkah dan mencapai sasaran tertentu. Tidak seperti satu panggilan model, agen dapat merencanakan, menjalankan serangkaian tindakan, berinteraksi dengan sistem eksternal, dan mensintesis informasi untuk memenuhi permintaan pengguna.

Dengan Gemini API, Anda dapat membangun agen yang andal dengan memanfaatkan fitur seperti:

  • Model Gemini: Kecerdasan inti, yang menyediakan penalaran dan pemahaman bahasa.
  • Alat: Kemampuan yang menghubungkan model ke informasi dan tindakan dunia nyata. Alat ini dapat berupa alat bawaan (seperti Google Penelusuran, Maps, Eksekusi Kode) atau alat kustom.
  • Panggilan fungsi: Mekanisme untuk menentukan dan menghubungkan alat dan API kustom Anda sendiri ke model Gemini.
  • Penalaran: Fitur yang meningkatkan kemampuan model untuk menalar dan merencanakan tugas yang kompleks.
  • Konteks panjang: Memungkinkan agen untuk mempertahankan status dan informasi selama interaksi yang diperpanjang.

Agen yang Tersedia

  • Agen Riset Mendalam: Agen otonom yang merencanakan, menjalankan, dan mensintesis tugas riset multi-langkah untuk kasus penggunaan seperti analisis pasar, uji tuntas, dan tinjauan literatur.

Membangun agen

Agen menggunakan model dan alat untuk menyelesaikan tugas multi-langkah. Meskipun Gemini menyediakan kemampuan penalaran ("otak") dan alat penting ("tangan"), Anda sering kali memerlukan framework orkestrasi untuk mengelola memori agen, loop rencana, dan melakukan chaining alat yang kompleks.

Untuk memaksimalkan keandalan dalam alur kerja multi-langkah, Anda harus membuat petunjuk yang secara eksplisit mengontrol cara model menalar dan merencanakan. Meskipun Gemini menyediakan penalaran umum yang kuat, agen yang kompleks akan mendapatkan manfaat dari perintah yang menerapkan perilaku tertentu seperti persistensi saat menghadapi masalah, penilaian risiko, dan perencanaan proaktif.

Lihat Alur kerja Agentic untuk mengetahui strategi dalam mendesain perintah ini. Berikut adalah contoh petunjuk sistem yang meningkatkan performa pada beberapa tolok ukur agentic sekitar 5%.

Framework agen

Gemini terintegrasi dengan framework agen open source terkemuka seperti:

  • LangChain / LangGraph: Membangun alur aplikasi stateful yang kompleks dan sistem multi-agen menggunakan struktur grafik.
  • LlamaIndex: Menghubungkan agen Gemini ke data pribadi Anda untuk alur kerja yang ditingkatkan RAG.
  • CrewAI: Mengorkestrasi agen AI otonom yang kolaboratif, memainkan peran.
  • Vercel AI SDK: Membangun antarmuka dan agen pengguna yang didukung AI di JavaScript/TypeScript.
  • Google ADK: Framework open source untuk membangun dan mengorkestrasi agen AI yang dapat beroperasi.