Agen adalah sistem yang memanfaatkan model Gemini, serangkaian alat, dan kemampuan penalaran untuk melakukan tugas multi-langkah yang kompleks dan mencapai sasaran tertentu. Tidak seperti panggilan model tunggal, agen dapat merencanakan, menjalankan serangkaian tindakan, berinteraksi dengan sistem eksternal, dan menyintesis informasi untuk memenuhi permintaan pengguna.
Dengan Gemini API, Anda dapat membuat agen yang canggih dengan memanfaatkan fitur seperti:
- Model Gemini: Kecerdasan inti, yang memberikan penalaran dan pemahaman bahasa.
- Alat: Kemampuan yang menghubungkan model ke informasi dan tindakan dunia nyata. Alat ini dapat berupa alat bawaan (seperti Google Penelusuran, Maps, Eksekusi Kode) atau alat kustom.
- Panggilan fungsi: Mekanisme untuk menentukan dan menghubungkan alat dan API kustom Anda sendiri ke model Gemini.
- Penalaran: Fitur yang meningkatkan kemampuan model untuk bernalar dan membuat rencana untuk tugas yang kompleks.
- Konteks panjang: Memungkinkan agen mempertahankan status dan informasi selama interaksi yang diperpanjang.
Agen yang Tersedia
- Agen Riset Mendalam: Agen otonom yang merencanakan, menjalankan, dan menyintesis tugas riset multilangkah untuk kasus penggunaan seperti analisis pasar, uji tuntas, dan peninjauan literatur.
Membangun agen
Agen menggunakan model dan alat untuk menyelesaikan tugas multi-langkah. Meskipun Gemini menyediakan kemampuan penalaran (otak) dan alat penting (tangan), Anda sering kali memerlukan framework orkestrasi untuk mengelola memori agen, merencanakan loop, dan melakukan rangkaian alat yang kompleks.
Untuk memaksimalkan keandalan dalam alur kerja multi-langkah, Anda harus membuat petunjuk yang secara eksplisit mengontrol cara model bernalar dan membuat rencana. Meskipun Gemini memberikan penalaran umum yang kuat, agen yang kompleks akan mendapatkan manfaat dari perintah yang menerapkan perilaku tertentu seperti kegigihan dalam menghadapi masalah, penilaian risiko, dan perencanaan proaktif.
Lihat Alur kerja Agentik untuk strategi dalam mendesain perintah ini. Berikut adalah contoh instruksi sistem yang meningkatkan performa pada beberapa tolok ukur agentik sekitar 5%.
Framework agen
Gemini terintegrasi dengan framework agen open source terkemuka seperti:
- LangChain / LangGraph: Bangun alur aplikasi yang kompleks dan memiliki status serta sistem multi-agen menggunakan struktur grafik.
- LlamaIndex: Menghubungkan agen Gemini ke data pribadi Anda untuk alur kerja yang ditingkatkan RAG.
- CrewAI: Mengatur agen AI otonom yang kolaboratif dan memainkan peran.
- Vercel AI SDK: Buat antarmuka pengguna dan agen yang didukung AI di JavaScript/TypeScript.
- Google ADK: Framework open source untuk membangun dan mengatur agen AI yang dapat beroperasi.