Anuj Sharma
Assistant vocal capable de voir le monde
Description
J'aime l'API de Google (Gemini) car elle fournit des résultats fructueux. Je souhaite réaliser mon projet mineur à l'aide de l'API Gemini.
Je crée une application Python ou un type de logiciel dans le but de créer une IA de singularité ou un assistant vocal. Il existe de nombreux codes ou projets dans lesquels les assistants vocaux reçoivent des commandes vocales et renvoient des résultats vocaux, mais ils ne peuvent pas voir notre requête sous forme de vision. J'ai donc créé ce type de projet à l'aide de l'API Gemini (pro et vision pro). Mon assistant vocal peut désormais également obtenir l'entrée sous forme d'image et répondre à ma réponse par écrit et par voix.
Conçu avec
- Aucun
- Firebase
Équipe
Par
Kritrim
De
Inde