Gemini Voice Companion
Usa Gemini de forma controlada por voz para el asistente personal
Qué hace
Es un asistente de voz potenciado por la IA de Gemini, que cuenta con capacidades locales de texto a voz y voz a texto que unen las interacciones de voz y texto. La API de Gemini se destaca en la comprensión del contexto y el envío de comandos para varias situaciones. A través de la compilación de contexto y el uso de integraciones de API, Gemini puede ejecutar secuencias de comandos de Python para realizar diversas funciones.
En esta aplicación, los usuarios pueden interactuar con el asistente por completo a través de la voz, lo que permite la operación con manos libres y sin ojos. Esto lo hace especialmente útil en situaciones en las que la voz es el único medio de comunicación disponible. Las capacidades del asistente incluyen las siguientes:
Reconocimiento de varias bocinas
Filtrado de ruido de voz desconocido
Control de dispositivos de casa inteligente
Imitación de la voz del usuario
Cambio entre diferentes voces y personalidades
Leer y resumir artículos de noticias
Obtener información sobre el clima y otros datos
Reproducir música de Spotify
Capturar fotos y analizarlas
Navegar por un vínculo a través de Chrome
Programar un recordatorio por voz o una acción genérica
La versatilidad del asistente con tecnología Gemini y su diseño centrado en la voz lo convierten en una herramienta potente para una amplia variedad de aplicaciones manos libres y sin necesidad de mirar la pantalla, como entretenimiento en el automóvil, guía de caminatas, administración de la casa, etcétera.
Con la tecnología de
- Web/Chrome
Equipo
De
Zhenya Yang
De
Australia