이제 Interactions API가 정식 버전으로 출시되었습니다. 이 API를 사용하여 모든 최신 기능과 모델에 액세스하는 것이 좋습니다.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6은 Gemini의 에이전트 기능을 로봇공학에 도입하는 시각-언어 모델 (VLM)입니다. 이 모델은 실제 세계에서 고급 추론을 수행하도록 설계되어 로봇이 복잡한 시각적 데이터를 해석하고, 공간 추론을 수행하고, 자연어 명령어에서 작업을 계획할 수 있도록 지원합니다.

Google AI Studio에서 사용해 보기

문서

기능 및 기능에 대한 전체 내용은 로봇공학 페이지를 참고하세요.

gemini-robotics-er-1.6-preview

속성	설명
모델 코드	`gemini-robotics-er-1.6-preview`
지원되는 데이터 유형	입력 텍스트, 이미지, 동영상, 오디오 출력 텍스트
토큰 한도^[*]	입력 토큰 한도 131,072 출력 토큰 한도 65,536
기능	오디오 생성 지원되지 않음 캐싱 지원됨 코드 실행 지원됨 컴퓨터 사용 지원됨 파일 검색 지원됨 함수 호출 지원됨 Google 지도 기반 그라운딩 지원됨 이미지 생성 지원되지 않음 Live API 지원되지 않음 검색 그라운딩 지원됨 구조화된 출력 지원됨 사고 지원됨 URL 컨텍스트 지원됨
소비 옵션	Batch API 지원됨 가변 추론 지원됨 우선순위 추론 지원됨
버전	자세한 내용은 모델 버전 패턴을 참고하세요. 미리보기: `gemini-robotics-er-1.6-preview`
최신 업데이트	2025년 12월
지식 단절	2025년 1월