EyeHear

Gemini – nowa era kompleksowego bezpieczeństwa domowego

Działanie

EyeHear używa interfejsu Gemini API, aby udostępnić kamery domofonowe osobom niedowidzącym. Gemini generuje szczegółowe opisy tekstowe filmów z wideodomofonu za pomocą promptów multimodalnych. Te tekstowe opisy są następnie konwertowane na dźwięk, który jest automatycznie odtwarzany w przeglądarce. Dzięki temu użytkownicy mogą „usłyszeć”, co dzieje się przy drzwiach, w tym zidentyfikować osoby, przesyłki lub inne zdarzenia. Metadane opisu filmu są przechowywane w Firebase na potrzeby historii i ewentualnych analiz.

Utworzone za pomocą

  • Sieć/Chrome
  • Firebase

Zespół

Autor:

ThatOrJohn

Od

Stany Zjednoczone