Gemini Robotics-ER 1.6 は、Gemini のエージェント機能をロボット工学に導入する視覚言語モデル(VLM)です。物理世界での高度な推論用に設計されており、ロボットが複雑な視覚データを解釈し、空間推論を実行し、自然言語コマンドからアクションを計画できます。
ドキュメント
機能と機能の全容については、ロボティクスのページをご覧ください。
gemini-robotics-er-1.6-preview
| プロパティ | 説明 |
|---|---|
| モデルコード | gemini-robotics-er-1.6-preview |
| でサポートされるデータ型 |
入力 テキスト、画像、動画、音声 出力 テキスト |
| トークン上限[*] |
入力トークンの上限 1,048,576 出力トークンの上限 65,536 |
| 機能 |
音声生成 サポート対象外 Batch API サポート対象 キャッシュ保存 サポート対象 コードの実行 サポート対象 コンピュータの使用 サポート対象 ファイル検索 サポート対象 Flex 推論 サポート対象 関数呼び出し サポート対象 Google マップによるグラウンディング サポート対象 画像生成 サポート対象外 Live API サポート対象外 候補の推論 サポート対象 検索によるグラウンディング サポート対象 構造化出力 サポート対象 思考モード サポート対象 URL コンテキスト サポート対象 |
| バージョン |
|
| 最終更新日 | 2025 年 12 月 |
| ナレッジ カットオフ | 2025 年 1 月 |