SecondEye

ผู้ช่วยภาพแบบอินเทอร์แอกทีฟและเรียนรู้ได้

การทำงาน

SecondEye เป็นผู้ช่วยภาพแบบอินเทอร์แอกทีฟที่สอนได้ ซึ่งสามารถใช้กับงานและ Use Case ต่างๆ ที่เกี่ยวข้องกับการมองเห็น นอกจากนี้ยังสอนให้ทำงานด้านวิสัยทัศน์ที่ปรับเปลี่ยนในแบบของคุณได้โดยไม่ต้องฝึกหรือเขียนโปรแกรม ทั้งหมดนี้ทำได้แบบอินเทอร์แอกทีฟและแบบซ้ำ
ปัจจุบัน SecondEye สร้างได้เฉพาะกับ Gemini เนื่องจากโมเดลนี้มีความสามารถพิเศษต่อไปนี้
1. การตรวจหาวัตถุที่แสดงตำแหน่งของกล่องขอบเขตที่แม่นยำ
2. การรองรับวิดีโอแบบเนทีฟที่แสดงข้อมูลที่มีการประทับเวลา
3. กรอบบริบทขนาดใหญ่
SecondEye ใช้ความสามารถเหล่านี้เพื่อมอบประสบการณ์การใช้งาน AI ที่ไม่เหมือนใครและใหม่ทั้งหมดต่อไปนี้
• สำหรับรูปภาพ (ใช้ความสามารถที่ 1):
◦ คําจํากัดความของวัตถุที่มีการกำกับเนื้อหา
◦ การถามเกี่ยวกับส่วนใดส่วนหนึ่งของรูปภาพ
◦ การเพิ่มประสิทธิภาพ:
▪ การค้นหาวัตถุ
▪ วิธีแก้ไขหรือรวบรวมคําถาม
▪ คําขอความคิดเห็นแบบภาพ
◦ การสอนโมเดลเกี่ยวกับส่วนที่กำกับเนื้อหาของรูปภาพ
• สำหรับวิดีโอ (ใช้ความสามารถที่ 2):
◦ ประสบการณ์การค้นหาวิดีโอที่ปรับปรุงแล้ว
• สำหรับวิดีโอจากกล้องแบบสด (ใช้ความสามารถที่ 3):
◦ การวิเคราะห์วิดีโอแบบเรียลไทม์ที่ปรับเปลี่ยนในแบบของคุณ
◦ การสอนโมเดลเกี่ยวกับสิ่งต่างๆ ด้วยวิดีโอ
◦ ความช่วยเหลือด้วยภาพแบบเรียลไทม์สำหรับผู้ที่มีความบกพร่องทางสายตา ซึ่งสามารถจดจำใบหน้า วัตถุ และสถานที่ต่างๆ เพื่อจดจำในอนาคต
• สําหรับการแชร์หน้าจอแบบเรียลไทม์ (ใช้ความสามารถที่ 3):
◦ การสอนเวิร์กโฟลว์ให้กับโมเดล
◦ การสนับสนุนด้านไอทีหรือการเขียนโปรแกรม
◦ ปรับปรุงการท่องเว็บและประสบการณ์การใช้งานคอมพิวเตอร์ทั่วไปสำหรับผู้ที่มีความบกพร่องทางสายตา

สร้างขึ้นด้วย

  • เว็บ/Chrome
  • Firebase
  • Firebase Genkit
  • การแปลงเสียงพูดเป็นข้อความ/การอ่านออกเสียงข้อความของ Google

ทีม

โดย

Zakaria KADDARI

จาก

โมร็อกโก