VisionAid
Mithilfe von KI sehbehinderten Menschen die Orientierung in der Welt erleichtern
Funktion
VisionAid ist eine innovative mobile App, die sehbehinderten Menschen dabei helfen soll, sich in ihrer Umgebung zurechtzufinden und mit ihr zu interagieren. Mit dem erweiterten Gemini 1.5-Flash-Modell von Google nimmt die App Bilder auf und sendet sie an Gemini. So können Nutzer alltägliche Objekte erkennen, sich in öffentlichen Bereichen zurechtfinden und sogar vertraute Gesichter und Haustiere erkennen. Das sorgt für mehr Konnektivität und Unabhängigkeit.
Dank der intuitiven Benutzeroberfläche von VisionAid können Nutzer ganz einfach Fragen zu ihrer Umgebung stellen und erhalten dank des Gemini-Flash-Modells und der Google Cloud Text-To-Speech API sofortige, präzise Antworten per Sprachfeedback. Ob es darum geht, Produkte in einem Supermarkt zu erkennen, eine belebte Straße sicher zu überqueren oder einen Freund zu erkennen: VisionAid dient als intelligenter Begleiter und gibt Nutzern die Zuversicht, die Welt auf ihre Weise zu entdecken.
VisionAid möchte Barrieren abbauen und die Welt für sehbehinderte Menschen zugänglicher machen. Mithilfe modernster Technologie wird die Unabhängigkeit gefördert und der Alltag erleichtert. VisionAid ist nicht nur eine App, sondern ein Schritt in eine Zukunft, in der dank der schnellen Weiterentwicklung der API jeder seine Umgebung mit Klarheit und Zuversicht erleben kann.
Basis
- Google Cloud Text-to-Speech
Team
Von
Deutschland