Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6은 Gemini의 에이전트 기능을 로봇 공학에 도입하는 비전 언어 모델 (VLM)입니다. 물리적 세계에서 고급 추론을 할 수 있도록 설계되어 로봇이 복잡한 시각적 데이터를 해석하고, 공간 추론을 수행하고, 자연어 명령에서 작업을 계획할 수 있습니다.

문서

로보틱스 페이지에서 기능과 기능의 전체 내용을 확인하세요.

gemini-robotics-er-1.6-preview

속성 설명
모델 코드 gemini-robotics-er-1.6-preview
지원 데이터 유형

입력

텍스트, 이미지, 동영상, 오디오

출력

텍스트

토큰 한도[*]

입력 토큰 한도

1,048,576

출력 토큰 한도

65,536

기능

오디오 생성

지원되지 않음

Batch API

지원됨

캐싱

지원됨

코드 실행

지원됨

컴퓨터 사용

지원됨

파일 검색

지원됨

유연한 추론

지원됨

함수 호출

지원됨

Google 지도 그라운딩

지원됨

이미지 생성

지원되지 않음

Live API

지원되지 않음

우선순위 추론

지원됨

검색 그라운딩

지원됨

구조화된 출력

지원됨

사고

지원됨

URL 컨텍스트

지원됨

버전
자세한 내용은 모델 버전 패턴을 참고하세요.
  • 미리보기: gemini-robotics-er-1.6-preview
최신 업데이트 2025년 12월
지식 단절 2025년 1월