Vision Crafters
Bezpiecznie poznawaj świat dzięki opisom generowanym przez Gemini.
Działanie
Cel:
Nasza aplikacja mobilna pomaga osobom niedowidzącym lepiej orientować się w otoczeniu. Za pomocą aparatu urządzenia aplikacja rejestruje obrazy lub filmy i przetwarza je za pomocą interfejsu Gemini API, aby wygenerować tekst opisowy, który następnie jest konwertowany na mowę. Aplikacja zawiera też gesty sterujące do robienia zdjęć i filmowania oraz funkcję wykrywania zagrożeń, która ostrzega o niebezpiecznych sytuacjach.
Integracja z Gemini:
Gemini jest integralną częścią naszej aplikacji i zapewnia zaawansowane możliwości przetwarzania obrazu na tekst. Przekształca dane wizualne z obrazów i filmów w dokładne, szczegółowe opisy tekstowe. Gemini doskonale rozpoznaje złożone sceny i potencjalne zagrożenia, zapewniając użytkownikom dokładne i przydatne informacje zwrotne. Ta funkcja jest kluczowa dla tworzenia dostępnych i pełnych informacji treści, dzięki czemu Gemini jest niezbędny zarówno do tworzenia tekstowych opisów, jak i wykrywania zagrożeń. Dodatkowo Gemini służy do generowania tytułów dla dzienników interakcji.
Funkcje:
- Przetwarzanie tekstu na tekst za pomocą Gemini.
- Przekształcanie tekstu w mowę, przekształcanie mowy w tekst i sterowanie gestami na potrzeby dostępności.
- Wykrywanie zagrożeń i ostrzeganie za pomocą Gemini.
- Dzienniki interakcji z tytułami wygenerowanymi przez Gemini.
Użytkownicy:
Użytkownicy niewidomi i ich opiekunowie.
Zalety:
- Lepsze zrozumienie otoczenia dzięki dźwiękowi.
- Większe bezpieczeństwo dzięki alertom o zagrożeniach.
- Większa niezależność i łatwy dostęp do dzienników.
Utworzone za pomocą
- Flutter
- Firebase
Zespół
Autor:
Vision Crafters
Od
Indie