Vision Crafters
Explora el mundo de forma segura con las descripciones de Gemini.
Qué hace
Objetivo:
Nuestra aplicación para dispositivos móviles permite que las personas con discapacidad visual comprendan mejor su entorno. Con la cámara del dispositivo, la app captura imágenes o videos y los procesa a través de la API de Gemini para generar texto descriptivo, que luego se convierte en voz. La app también cuenta con controles de gestos para capturar fotos o videos, y tiene integrada la detección de peligros para activar alarmas en situaciones peligrosas.
Integración de Gemini:
Gemini es un elemento fundamental de nuestra app, ya que ofrece capacidades avanzadas de procesamiento de escenas a texto. Traduce los datos visuales de imágenes y videos en descripciones textuales precisas y detalladas. Gemini se destaca por reconocer escenas complejas y detectar posibles peligros, lo que les brinda a los usuarios comentarios precisos y prácticos. Esta funcionalidad es fundamental para crear una experiencia accesible y informativa, lo que hace que Gemini sea esencial para las descripciones de texto y la detección de peligros. Además, Gemini se usa para generar títulos para los registros de interacción.
Funciones:
- Procesamiento de escena a texto con Gemini.
- Controles de texto a voz, voz a texto y gestos para accesibilidad.
- Detección de peligros con Gemini y alertas.
- Registros de interacción con títulos generados por Gemini.
Usuarios finales:
Diseñado para personas con discapacidad visual y sus cuidadores.
Beneficios:
- Mayor comprensión del entorno a través del audio.
- Mayor seguridad con alertas de peligro.
- Mayor independencia y acceso sencillo a los registros.
Con la tecnología de
- Flutter
- Firebase
Equipo
De
Vision Crafters
De
India