Anuj Sharma
Asistente de voz que puede ver el mundo
Qué hace
Me encanta la API de Google (Gemini) porque proporciona resultados completos y quiero hacer mi proyecto menor con la ayuda de la API de Gemini. Por lo tanto,
creo una aplicación de Python o un tipo de software con la visión de crear una IA de singularidad o un asistente de voz. Ahora hay muchos códigos o proyectos en los que los asistentes de voz toman el comando por voz y muestran el resultado por voz, pero no pueden ver nuestra consulta en forma de visión. Por lo tanto, hice este tipo de proyecto con la ayuda de la API de Gemini (pro y vision pro). Ahora, mi asistente de voz también puede obtener la entrada como imagen y responder mi respuesta en texto y en voz.
Con la tecnología de
- Ninguno
- Firebase
Equipo
De
Kritrim
De
India