Optima Ve
Gemini 1.5 Pro – pomoc osobom niedowidzącym w utrzymywaniu niezależności
Działanie
Optima Ve – zwiększenie niezależności osób niedowidzących
Optima Ve to innowacyjne i skuteczne rozwiązanie, które umożliwia osobom niedowidzącym większą niezależność w codziennym życiu. Optima Ve wykorzystuje multimodalny model uczenia się języka (LLM) Gemini 1.5 Pro od Google, który płynnie łączy technologie widzenia i głosu, aby zapewnić intuicyjną obsługę.
Cel i wizja:
Optima Ve ma na celu zapewnienie osobom niedowidzącym płynnego i przyjaznego dla użytkownika sposobu wykonywania codziennych zadań na smartfonach, co zwiększa ich niezależność i łagodzi problemy związane z niedowidzeniem.
Główna funkcjonalność:
Zrozumienie kontekstu: LLM w Gemini 1.5 Pro dokładnie analizuje zapytania użytkowników, interpretując złożone żądania i zadając pytania wyjaśniające. Dzięki temu AI może dokładnie interpretować dane przed wykonaniem zadań.
Wykonywanie zadań: po zrozumieniu problemu AI wykonuje zadania takie jak rozpoznawanie obiektów, czytanie tekstu czy nawigacja po przestrzeni, rozwiązując przy tym wiele codziennych problemów.
Interakcja głosowa: Whisper to zaawansowany mechanizm konwersji mowy na tekst, który umożliwia naturalną, konwersacyjną interakcję głosową, ułatwiając komunikację.
Funkcje związane ze wzrokiem: aplikacja wykorzystuje kamerę smartfona do przetwarzania danych wideo, pomagając użytkownikom w lokalizowaniu przedmiotów, rozpoznawaniu przeszkód i czytaniu tekstu.
Utworzone za pomocą
- Android
- Wersja internetowa/Chrome
- React Native
- Szept
Zespół
Autor:
OptimaVe – Enabling Independence
Od
Pakistan