SecondEye
ผู้ช่วยภาพแบบอินเทอร์แอกทีฟและเรียนรู้ได้
การทำงาน
SecondEye เป็นผู้ช่วยภาพแบบอินเทอร์แอกทีฟที่สอนได้ ซึ่งสามารถใช้กับงานและ Use Case ต่างๆ ที่เกี่ยวข้องกับการมองเห็น นอกจากนี้ยังสอนให้ทำงานด้านวิสัยทัศน์ที่ปรับเปลี่ยนในแบบของคุณได้โดยไม่ต้องฝึกหรือเขียนโปรแกรม ทั้งหมดนี้ทำได้แบบอินเทอร์แอกทีฟและแบบซ้ำ
ปัจจุบัน SecondEye สร้างได้เฉพาะกับ Gemini เนื่องจากโมเดลนี้มีความสามารถพิเศษต่อไปนี้
1. การตรวจหาวัตถุที่แสดงตำแหน่งของกล่องขอบเขตที่แม่นยำ
2. การรองรับวิดีโอแบบเนทีฟที่แสดงข้อมูลที่มีการประทับเวลา
3. กรอบบริบทขนาดใหญ่
SecondEye ใช้ความสามารถเหล่านี้เพื่อมอบประสบการณ์การใช้งาน AI ที่ไม่เหมือนใครและใหม่ทั้งหมดต่อไปนี้
• สำหรับรูปภาพ (ใช้ความสามารถที่ 1):
◦ คําจํากัดความของวัตถุที่มีการกำกับเนื้อหา
◦ การถามเกี่ยวกับส่วนใดส่วนหนึ่งของรูปภาพ
◦ การเพิ่มประสิทธิภาพ:
▪ การค้นหาวัตถุ
▪ วิธีแก้ไขหรือรวบรวมคําถาม
▪ คําขอความคิดเห็นแบบภาพ
◦ การสอนโมเดลเกี่ยวกับส่วนที่กำกับเนื้อหาของรูปภาพ
• สำหรับวิดีโอ (ใช้ความสามารถที่ 2):
◦ ประสบการณ์การค้นหาวิดีโอที่ปรับปรุงแล้ว
• สำหรับวิดีโอจากกล้องแบบสด (ใช้ความสามารถที่ 3):
◦ การวิเคราะห์วิดีโอแบบเรียลไทม์ที่ปรับเปลี่ยนในแบบของคุณ
◦ การสอนโมเดลเกี่ยวกับสิ่งต่างๆ ด้วยวิดีโอ
◦ ความช่วยเหลือด้วยภาพแบบเรียลไทม์สำหรับผู้ที่มีความบกพร่องทางสายตา ซึ่งสามารถจดจำใบหน้า วัตถุ และสถานที่ต่างๆ เพื่อจดจำในอนาคต
• สําหรับการแชร์หน้าจอแบบเรียลไทม์ (ใช้ความสามารถที่ 3):
◦ การสอนเวิร์กโฟลว์ให้กับโมเดล
◦ การสนับสนุนด้านไอทีหรือการเขียนโปรแกรม
◦ ปรับปรุงการท่องเว็บและประสบการณ์การใช้งานคอมพิวเตอร์ทั่วไปสำหรับผู้ที่มีความบกพร่องทางสายตา
สร้างขึ้นด้วย
- เว็บ/Chrome
- Firebase
- Firebase Genkit
- การแปลงเสียงพูดเป็นข้อความ/การอ่านออกเสียงข้อความของ Google
ทีม
โดย
Zakaria KADDARI
จาก
โมร็อกโก