Vision Crafters
Descubra o mundo com segurança usando as descrições do Gemini.
O que faz?
Objetivo:
Nosso app para dispositivos móveis ajuda pessoas com deficiência visual a entender melhor o ambiente. Usando a câmera do dispositivo, o app captura imagens ou vídeos e os processa pela API Gemini para gerar texto descritivo, que é convertido em fala. O app também tem controles por gestos para captura de fotos/vídeos e integra a detecção de perigos para acionar alarmes em situações de risco.
Integração do Gemini
:o Gemini é parte integrante do nosso app, oferecendo recursos avançados de processamento de cena para texto. Ele traduz dados visuais de imagens e vídeos em descrições textuais precisas e detalhadas. O Gemini se destaca em reconhecer cenas complexas e identificar possíveis perigos, oferecendo aos usuários um feedback preciso e útil. Essa funcionalidade é essencial para criar uma experiência acessível e informativa, tornando o Gemini essencial para descrições de texto e detecção de perigos. Além disso, o Gemini é usado para gerar títulos de registros de interação.
Recursos:
-Processamento de cena para texto com o Gemini.
-Texto para fala, fala para texto e controles de gesto para acessibilidade.
-Detecção de perigos com o Gemini e alertas.
-Registros de interação com títulos gerados pelo Gemini.
Usuários finais:
Projetado para pessoas com deficiência visual e cuidadores.
Benefícios:
-Melhor compreensão do ambiente por áudio.
-Maior segurança com alertas de perigo.
-Maior independência e acesso fácil aos registros.
Desenvolvido com
- Flutter
- Firebase
Equipe
Por
Vision Crafters
De
Índia