VisionAid

ช่วยให้ผู้ที่บกพร่องทางสายตาไปยังส่วนต่างๆ ของโลกได้โดยใช้ความสามารถของ AI

การทำงาน

VisionAid เป็นแอปพลิเคชันบนอุปกรณ์เคลื่อนที่ที่ล้ำสมัยซึ่งออกแบบมาเพื่อส่งเสริมผู้ที่มีความบกพร่องทางสายตาด้วยการเพิ่มความสามารถในการไปยังส่วนต่างๆ และโต้ตอบกับโลกรอบตัว แอปใช้ประโยชน์จากโมเดล Flash ขั้นสูงของ Gemini 1.5 ของ Google เพื่อจับภาพและส่งไปยัง Gemini ซึ่งช่วยให้ผู้ใช้ระบุวัตถุในชีวิตประจำวัน ไปยังพื้นที่สาธารณะ และแม้แต่จดจำใบหน้าและสัตว์เลี้ยงที่คุ้นเคยได้ เพื่อสร้างประสบการณ์การใช้งานที่เชื่อมต่อและอิสระมากขึ้น

อินเทอร์เฟซที่ใช้งานง่ายของ VisionAid ช่วยให้ผู้ใช้ถามคำถามเกี่ยวกับสิ่งรอบตัวได้ง่ายขึ้นด้วยคำตอบที่ถูกต้องและรวดเร็วผ่านฟีดแบ็กเสียง ซึ่งมาจากโมเดล Flash ของ Gemini และ Google Cloud Text-To-Speech API ไม่ว่าจะเป็นการระบุสินค้าในร้านขายของใช้ทั่วไป ข้ามถนนที่วุ่นวายอย่างปลอดภัย หรือจดจำเพื่อน VisionAid จะทำหน้าที่เป็นเพื่อนที่ชาญฉลาด ซึ่งช่วยให้ผู้ใช้สำรวจโลกได้อย่างมั่นใจ

VisionAid มีเป้าหมายเพื่อทลายอุปสรรคและทำให้โลกเข้าถึงได้ง่ายขึ้นสำหรับผู้ที่มีความบกพร่องทางสายตา โดยใช้เทคโนโลยีล้ำสมัยเพื่อส่งเสริมความเป็นอิสระและปรับปรุงการใช้ชีวิตในแต่ละวัน VisionAid ไม่ได้เป็นเพียงแอป แต่ยังเป็นก้าวสู่อนาคตที่ทุกคนสามารถสัมผัสกับสิ่งรอบตัวได้อย่างชัดเจนและมั่นใจด้วยการพัฒนา API ที่รวดเร็ว

สร้างขึ้นด้วย

  • Text-To-Speech ของ Google Cloud

ทีม

จาก

เยอรมนี