SmartVision

Tag Line: Empowering your world, Navigate life with confidence

Działanie

SmartVision to mobilny asystent dla osób z zaburzeniami wzroku
,który zapewnia im większą dostępność,
niezależność i pomoc w codziennym życiu. Ten asystent mobilny wykorzystuje technologię, aby oferować szeroką gamę funkcji dostosowanych do potrzeb osób niedowidzących. Ma to ułatwić im codzienne czynności i ułatwić im uczestnictwo w życiu społecznym.
Ta aplikacja na Androida zawiera funkcje takie jak wykrywanie obiektów, streszczanie dokumentów, tryb czytania, wykrywanie twarzy i skanowanie produktów. Funkcje wykrywania obiektów i podsumowywania dokumentów są tworzone za pomocą interfejsu Gemini API.Funkcja wykrywania obiektów korzysta z modelu Gemini-1.5-Flash, ponieważ jest on szybszy niż model Gemini-1.5-Pro. Aby korzystać z funkcji wykrywania obiektów, użytkownik musi nosić na głowie inteligentną czapkę z wbudowanym modułem kamery z dostępem do Wi-Fi. Zdjęcia zrobione za pomocą tej kamery będą wyświetlane w aplikacji mobilnej i wysyłane do zdalnego interfejsu Gemini API, aby opisane w czasie rzeczywistym obrazy mogły być odczytywane przez ten interfejs. Opis będzie odczytywany lub ogłaszany użytkownikowi za pomocą funkcji konwersji tekstu na mowę, co ułatwia korzystanie z aplikacji osobom niedowidzącym. Ponadto dokumenty podsumowujące(tylko PDF) są tworzone za pomocą modelu Gemini 1.5-pro. Aby korzystać z tej funkcji, użytkownik musi wybrać dokument PDF znajdujący się w pamięci telefonu i ustawić tekst promptu (np. podsumować dokument PDF w 150 słowach). Gemini API streszcza zawartość tekstową w pliku PDF i ogłasza ją użytkownikowi.

Utworzone za pomocą

  • Android
  • ML-Kit(etykietowanie obrazów)
  • Wykrywanie i śledzenie obiektów
  • Rozpoznawanie tekstu
  • Skanowanie kodów kreskowych
  • Wykrywanie twarzy

Zespół

Autor:

SmartVision (członkowie zespołu : Karthik Ramachandran)

Od

Indie