SecondEye

대화형 및 학습 가능한 시각적 어시스턴트

기능

SecondEye는 대화형이며 학습 가능한 시각적 어시스턴트입니다. 다양한 비전 관련 작업 및 사용 사례에 사용할 수 있습니다. 또한 학습이나 프로그래밍 없이 맞춤형 비전 작업을 실행하도록 학습할 수 있습니다. 모두 상호작용적이고 반복적인 방식으로 이루어집니다.
SecondEye는 현재 Gemini로만 빌드할 수 있습니다. 다음과 같은 모델의 고유한 기능 때문입니다.
1. 정확한 경계 상자 위치를 반환하는 기능이 있는 객체 감지
2. 타임스탬프 정보를 반환하는 기능이 있는 네이티브 동영상 지원
3. 대규모 컨텍스트 창
SecondEye는 이러한 기능을 활용하여 다음과 같은 고유하고 완전히 새로운 AI 환경을 제공합니다.
• 이미지 (기능 1 사용):
◦ 주석이 달린 객체 정의
◦ 이미지의 특정 부분에 관해 질문하기
◦ 개선:
▪ 객체 검색
▪ 질문 수정 또는 조합 방법
▪ 시각적 의견 요청
◦ 이미지의 주석이 달린 부분에 관해 모델에 학습시키기
• 동영상 (기능 2 사용):
◦ 향상된 동영상 검색 환경
• 실시간 카메라 동영상 (기능 3 사용):
◦ 맞춤설정된 실시간 동영상 분석
◦ 동영상으로 모델에 학습시키기
◦ 시각 장애인을 위한 실시간 시각적 지원으로, 향후 인식할 얼굴, 객체, 장소를 기억할 수 있습니다.
• 실시간 화면 공유 (기능 3 사용):
◦ 모델에 워크플로를 가르칩니다.
◦ IT 또는 프로그래밍 지원.
◦ 시각 장애가 있는 사용자를 위한 웹 탐색 및 일반적인 컴퓨터 환경을 개선합니다.

구성용 제품

  • 웹/Chrome
  • Firebase
  • Firebase Genkit
  • Google Speech-to-Text/Text-to-Speech

작성자:

자카리아 카다리

From

모로코