Gemini Robotics-ER 1.6은 Gemini의 에이전트 기능을 로봇공학에 도입하는 시각-언어 모델 (VLM)입니다. 이 모델은 실제 세계에서 고급 추론을 수행하도록 설계되어 로봇이 복잡한 시각적 데이터를 해석하고, 공간 추론을 실행하고, 자연어 명령어에서 작업을 계획할 수 있도록 지원합니다.
문서
기능 및 기능에 대한 전체 내용은 로봇공학 페이지를 참고하세요.
gemini-robotics-er-1.6-preview
| 속성 | 설명 |
|---|---|
| 모델 코드 | gemini-robotics-er-1.6-preview |
| 지원되는 데이터 유형 |
입력 텍스트, 이미지, 동영상, 오디오 출력 텍스트 |
| 토큰 한도[*] |
입력 토큰 한도 131,072 출력 토큰 한도 65,536 |
| 기능 |
오디오 생성 지원되지 않음 Batch API 지원됨 캐싱 지원됨 코드 실행 지원됨 컴퓨터 사용 지원됨 파일 검색 지원됨 가변 추론 지원됨 함수 호출 지원됨 Google 지도 기반 그라운딩 지원됨 이미지 생성 지원되지 않음 Live API 지원되지 않음 우선순위 추론 지원됨 검색 그라운딩 지원됨 구조화된 출력 지원됨 사고 지원됨 URL 컨텍스트 지원됨 |
| 버전 |
|
| 최신 업데이트 | 2025년 12월 |
| 지식 단절 | 2025년 1월 |