Vision Crafters
สำรวจโลกอย่างปลอดภัยผ่านคำอธิบายที่ Gemini ขับเคลื่อน
การทำงาน
วัตถุประสงค์:
แอปบนอุปกรณ์เคลื่อนที่ของเราช่วยให้ผู้ที่มีความบกพร่องทางสายตาสามารถใช้ชีวิตได้อย่างอิสระมากขึ้นด้วยการเพิ่มความเข้าใจเกี่ยวกับสภาพแวดล้อมรอบตัว แอปจะใช้กล้องของอุปกรณ์เพื่อจับภาพหรือวิดีโอและประมวลผลผ่าน Gemini API เพื่อสร้างข้อความอธิบาย จากนั้นจึงแปลงเป็นคำพูด แอปยังมีการควบคุมด้วยท่าทางสัมผัสสำหรับการจับภาพรูปภาพ/วิดีโอ และผสานรวมการตรวจหาอันตรายเพื่อส่งเสียงเตือนในสถานการณ์ที่เป็นอันตราย
การผสานรวม Gemini:
Gemini เป็นส่วนสำคัญของแอปของเรา ซึ่งมอบความสามารถในการประมวลผลจากภาพเป็นข้อความขั้นสูง โดยระบบจะแปลข้อมูลภาพจากรูปภาพและวิดีโอเป็นคำอธิบายที่เป็นข้อความที่ถูกต้องและละเอียด Gemini เชี่ยวชาญในการจดจำฉากที่ซับซ้อนและระบุอันตรายที่อาจเกิดขึ้น ซึ่งจะช่วยให้ผู้ใช้ได้รับความคิดเห็นที่แม่นยำและนำไปใช้ได้จริง ฟังก์ชันการทำงานนี้มีความสำคัญอย่างยิ่งต่อการสร้างประสบการณ์การใช้งานที่เข้าถึงได้และมีข้อมูล ทำให้ Gemini เป็นองค์ประกอบสำคัญสำหรับทั้งคำอธิบายแบบข้อความและการตรวจหาอันตราย นอกจากนี้ ระบบยังใช้ Gemini เพื่อสร้างชื่อบันทึกการโต้ตอบ
ฟีเจอร์:
-การประมวลผลจากภาพเป็นข้อความด้วย Gemini
-การอ่านออกเสียงข้อความ การเปลี่ยนคำพูดเป็นข้อความ และการควบคุมด้วยท่าทางสัมผัสสำหรับการช่วยเหลือพิเศษ
-การตรวจหาอันตรายด้วย Gemini และการแจ้งเตือน
-บันทึกการโต้ตอบที่มีชื่อที่ Gemini สร้างขึ้น
ผู้ใช้ปลายทาง:
ออกแบบมาสำหรับผู้ที่มีความบกพร่องทางสายตาและผู้ดูแล
ประโยชน์:
-เพิ่มความเข้าใจเกี่ยวกับสภาพแวดล้อมผ่านเสียง
-เพิ่มความปลอดภัยด้วยการแจ้งเตือนอันตราย
-เพิ่มความเป็นอิสระและเข้าถึงบันทึกได้ง่าย
สร้างขึ้นด้วย
- Flutter
- Firebase
ทีม
โดย
Vision Crafters
จาก
อินเดีย