DeepLook
DeepLook เป็นแพลตฟอร์มเฝ้าระวังวิดีโอและการวิเคราะห์ที่ใช้ AI
การทำงาน
DeepLook เป็นแพลตฟอร์มนวัตกรรมที่ใช้โมเดล Gemini เพื่อเพิ่มฟังก์ชันการทำงานของ Generative AI ให้กับวิดีโอเฝ้าระวังและการวิเคราะห์ ฟังก์ชันการทำงานเหล่านี้มีตั้งแต่การควบคุมอินเทอร์เฟซ UI ผ่านแชทหรือเสียงไปจนถึงการวิเคราะห์วิดีโออัจฉริยะและการตรวจจับเหตุการณ์ในกล้อง DeepLook ทำงานได้โดยใช้ภาษาที่เป็นธรรมชาติ เช่น เปิดกล้องอย่างรวดเร็ว เข้าถึงไฟล์บันทึก และส่งออกวิดีโอโดยไม่ต้องใช้เมนูและวิดเจ็ตที่หายาก และที่สำคัญที่สุดคือ คุณสามารถถามและตอบคำถามเกี่ยวกับกล้องสด สรุปไฟล์บันทึกที่ผ่านมา ตรวจจับวัตถุ และแม้แต่แจ้งให้ครอบครัวทราบว่าคนอยู่คนเดียวเป็นอย่างไรบ้างผ่านการวิเคราะห์จาก Vision นอกจากนี้ ยังทริกเกอร์เหตุการณ์ตามประโยคได้ เช่น "มีคนตกไหม" "แจ้งเตือนหากมีอาวุธปรากฏขึ้น" หรือการวิเคราะห์สถานการณ์ในบริบทของการดูแลผู้สูงอายุ เช่น การตรวจสอบผู้สูงอายุ
นอกจากนี้ DeepLook ยังแจ้งเตือนผู้ใช้หากเกิดเหตุการณ์ที่บันทึกไว้ และทำการเคลื่อนกล้อง PTZ ด้วยตนเองหรืออัตโนมัติ เช่น การจัดกล้องให้อยู่ตรงกลางวัตถุในเฟรมที่กำหนดไว้โดยอัตโนมัติ
ระบบจะทำงานร่วมกับ Gemini-Flash เป็นหลักเนื่องจากอัตราส่วนต้นทุน-ผลลัพธ์ การแยกวิเคราะห์คําสั่งอาศัยการเรียกฟังก์ชัน AI ของ Vertex เป็นอย่างมาก การวิเคราะห์รูปภาพใช้ได้กับตัวอย่างวิดีโอและภาพโมเสคที่แบ่งออกเป็นส่วนๆ ซึ่งส่งผ่านพรอมต์ไปยัง API ของโมเดล DeepLook จะมีเวอร์ชันเว็บและ Android เซิร์ฟเวอร์สามารถทำงานบน Firebase App Host และ Cloud Run โดยใช้ตัวแทนที่เชื่อมต่อกล้องในเครื่อง ซึ่งทำหน้าที่เป็นบริดจ์ระหว่างกล้องกับเซิร์ฟเวอร์
สร้างขึ้นด้วย
- เว็บ/Chrome
- Cloud Run
- โครงสร้างพื้นฐานของ Google Cloud
ทีม
โดย
DeepLook
จาก
อิตาลี