Live-Assistent für blinde Menschen

KI-gestützte Echtzeit-Hilfe-App für sehbehinderte Personen.

Funktion

Unsere App, die für blinde Nutzer entwickelt wurde, nutzt die Gemini API, um in Echtzeit eine beschreibende Unterstützung durch Spracherkennung und Computer Vision bereitzustellen. Nutzer können Beschreibungen ihrer Umgebung oder aufgenommener Bilder anfordern, um Barrierefreiheit und Sicherheit zu verbessern. Die Gemini API ermöglicht die Erstellung genauer und kontextbezogener Beschreibungen, damit sehbehinderte Nutzer ihre Umgebung unabhängig erkunden und mit ihr interagieren können. Ich habe die Gemini API verwendet, um das von der App gesendete Bild zu beschreiben, um die blinden Personen vor Gefahren zu warnen oder ihnen zu helfen, Objekte und Orte zu identifizieren.

Basis

  • Python

Team

Von

Rojan Sapkota

Von

Nepal