Vision Crafters

สำรวจโลกอย่างปลอดภัยผ่านคำอธิบายที่ Gemini ขับเคลื่อน

การทำงาน

วัตถุประสงค์:
แอปบนอุปกรณ์เคลื่อนที่ของเราช่วยให้ผู้ที่มีความบกพร่องทางสายตาสามารถใช้ชีวิตได้อย่างอิสระมากขึ้นด้วยการเพิ่มความเข้าใจเกี่ยวกับสภาพแวดล้อมรอบตัว แอปจะใช้กล้องของอุปกรณ์เพื่อจับภาพหรือวิดีโอและประมวลผลผ่าน Gemini API เพื่อสร้างข้อความอธิบาย จากนั้นจึงแปลงเป็นคำพูด แอปยังมีการควบคุมด้วยท่าทางสัมผัสสำหรับการจับภาพรูปภาพ/วิดีโอ และผสานรวมการตรวจหาอันตรายเพื่อส่งเสียงเตือนในสถานการณ์ที่เป็นอันตราย

การผสานรวม Gemini:
Gemini เป็นส่วนสำคัญของแอปของเรา ซึ่งมอบความสามารถในการประมวลผลจากภาพเป็นข้อความขั้นสูง โดยระบบจะแปลข้อมูลภาพจากรูปภาพและวิดีโอเป็นคำอธิบายที่เป็นข้อความที่ถูกต้องและละเอียด Gemini เชี่ยวชาญในการจดจำฉากที่ซับซ้อนและระบุอันตรายที่อาจเกิดขึ้น ซึ่งจะช่วยให้ผู้ใช้ได้รับความคิดเห็นที่แม่นยำและนำไปใช้ได้จริง ฟังก์ชันการทำงานนี้มีความสำคัญอย่างยิ่งต่อการสร้างประสบการณ์การใช้งานที่เข้าถึงได้และมีข้อมูล ทำให้ Gemini เป็นองค์ประกอบสำคัญสำหรับทั้งคำอธิบายแบบข้อความและการตรวจหาอันตราย นอกจากนี้ ระบบยังใช้ Gemini เพื่อสร้างชื่อบันทึกการโต้ตอบ

ฟีเจอร์:
-การประมวลผลจากภาพเป็นข้อความด้วย Gemini
-การอ่านออกเสียงข้อความ การเปลี่ยนคำพูดเป็นข้อความ และการควบคุมด้วยท่าทางสัมผัสสำหรับการช่วยเหลือพิเศษ
-การตรวจหาอันตรายด้วย Gemini และการแจ้งเตือน
-บันทึกการโต้ตอบที่มีชื่อที่ Gemini สร้างขึ้น

ผู้ใช้ปลายทาง:
ออกแบบมาสำหรับผู้ที่มีความบกพร่องทางสายตาและผู้ดูแล

ประโยชน์:
-เพิ่มความเข้าใจเกี่ยวกับสภาพแวดล้อมผ่านเสียง
-เพิ่มความปลอดภัยด้วยการแจ้งเตือนอันตราย
-เพิ่มความเป็นอิสระและเข้าถึงบันทึกได้ง่าย

สร้างขึ้นด้วย

  • Flutter
  • Firebase

ทีม

โดย

Vision Crafters

จาก

อินเดีย