Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 は、Gemini のエージェント機能をロボット工学に導入する視覚言語モデル(VLM)です。物理世界での高度な推論用に設計されており、ロボットが複雑な視覚データを解釈し、空間推論を実行し、自然言語コマンドからアクションを計画できます。

ドキュメント

機能と機能の全容については、ロボティクスのページをご覧ください。

gemini-robotics-er-1.5-preview

プロパティ 説明
モデルコード gemini-robotics-er-1.5-preview
でサポートされるデータ型

入力

テキスト、画像、動画、音声

出力

テキスト

トークン上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

65,536

機能

音声生成

サポート対象外

Batch API

サポート対象外

キャッシュ保存

サポート対象外

コードの実行

サポート対象

関数呼び出し

サポート対象

Google マップによるグラウンディング

サポート対象外

画像生成

サポート対象外

Live API

サポート対象外

検索によるグラウンディング

サポート対象

構造化出力

サポート対象

思考モード

サポート対象

URL コンテキスト

サポート対象

バージョン
詳細については、モデル バージョンのパターンをご覧ください。
  • プレビュー: gemini-robotics-er-1.5-preview
最終更新日 2025 年 9 月
ナレッジ カットオフ 2025 年 1 月