DeepLook

DeepLook là một nền tảng phân tích và giám sát video dựa trên AI

Ý nghĩa

DeepLook là một nền tảng sáng tạo sử dụng các mô hình Gemini để thêm các chức năng AI tạo sinh vào hoạt động giám sát và phân tích video. Các chức năng này bao gồm việc kiểm soát giao diện người dùng thông qua tính năng trò chuyện hoặc giọng nói, cho đến việc phân tích video thông minh và phát hiện sự kiện trên camera. DeepLook có thể thực hiện các thao tác bằng ngôn ngữ tự nhiên, chẳng hạn như mở nhanh máy ảnh, truy cập vào bản ghi và xuất video mà không cần sử dụng trình đơn và các tiện ích khó tìm. Quan trọng nhất là thông qua công cụ phân tích của Vision, bạn có thể thực hiện hoạt động hỏi đáp trên máy quay trực tiếp, tóm tắt bản ghi trước đây, phát hiện đối tượng và thậm chí cho gia đình biết người sống một mình đang làm gì. Ngoài ra, tính năng này có thể kích hoạt các sự kiện dựa trên câu, chẳng hạn như "Có ai ngã không?", "Cảnh báo nếu có vũ khí xuất hiện" hoặc phân tích tình huống trong bối cảnh chăm sóc người lớn, chẳng hạn như theo dõi người già.

Ngoài ra, DeepLook có thể cảnh báo người dùng nếu các sự kiện đã đăng ký xảy ra và thực thi các chuyển động PTZ thủ công hoặc tự động trên máy ảnh, chẳng hạn như tự động căn giữa máy ảnh trên một đối tượng khung đã xác định.
 
Hệ thống này chủ yếu hoạt động với Gemini-flash do tỷ lệ chi phí-lợi ích. Việc phân tích cú pháp các lệnh phụ thuộc rất nhiều vào tính năng Gọi hàm AI đỉnh. Tính năng phân tích hình ảnh hoạt động với các đoạn video và ảnh ghép xếp kề được gửi thông qua lời nhắc đến API mô hình. DeepLook sẽ có phiên bản Web và Android. Máy chủ có thể chạy trên Máy chủ lưu trữ ứng dụng Firebase và Cloud Run, sử dụng một tác nhân kết nối các máy ảnh cục bộ, đóng vai trò là cầu nối giữa các máy ảnh và máy chủ.

Được tạo bằng

  • Web/Chrome
  • Cloud Run
  • Cơ sở hạ tầng của Google Cloud

Nhóm

Người cập nhật

DeepLook

Từ

Ý