Google 検索によるグラウンディングが利用できるようになりました。詳細

このページは Cloud Translation API によって翻訳されました。

双子座モデル

1.5 Flash

ほとんどのタスクで優れたパフォーマンスを発揮する、最もバランスの取れたマルチモーダルモデル

音声、画像、動画、テキストを入力して、テキストレスポンスを取得する
コードの生成、データの抽出、テキストの編集など
パフォーマンスと費用のバランスを取るタスクに最適

1.5 Flash-8B

最も高速で費用対効果の高いマルチモーダルモデル。高頻度のタスクで優れたパフォーマンスを発揮します。

音声、画像、動画、テキストを入力して、テキストレスポンスを取得する
コードの生成、データの抽出、テキストの編集など
インテリジェンスが低く、頻度の高いタスクに最適

1.5 Pro

さまざまな推論タスク向けの特徴量を備えた、Google の最高性能のマルチモーダルモデル

音声、画像、動画、テキストを入力して、テキストレスポンスを取得する
コードの生成、データの抽出、テキストの編集など
パフォーマンスの向上が必要な場合

モデルバリエーション

Gemini API には、特定のユースケース用に最適化されたさまざまなモデルが用意されています。利用可能な Gemini のバリエーションの概要は次のとおりです。

モデルバリエーション	入力	出力	最適な用途
Gemini 1.5 Flash `gemini-1.5-flash`	音声、画像、動画、テキスト	テキスト	さまざまなタスクで高速で汎用性の高いパフォーマンスを実現
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	音声、画像、動画、テキスト	テキスト	大量の低インテリジェンスタスク
Gemini 1.5 Pro `gemini-1.5-pro`	音声、画像、動画、テキスト	テキスト	より高度なインテリジェンスを必要とする複雑な推論タスク
Gemini 1.0 Pro（2025 年 2 月 15 日をもってサポート終了） `gemini-1.0-pro`	テキスト	テキスト	自然言語タスク、マルチターンテキストとコードチャット、コード生成
テキストエンベディング `text-embedding-004`	テキスト	テキストエンベディング	テキスト文字列の関連性の測定
AQA `aqa`	テキスト	テキスト	質問にソースに基づく回答を提供すること

Gemini 1.5 Flash

Gemini 1.5 Flash は、さまざまなタスク全体にスケーリングできる、高速で汎用性の高いマルチモーダルモデルです。

AI Studio で試す

モデルの詳細

プロパティ	説明
モデルコード	`models/gemini-1.5-flash`
: サポートされているデータ型	入力音声、画像、動画、テキスト出力テキスト
トークンの上限^[*]	入力トークンの上限 1,048,576 出力トークンの上限 8,192
音声/映像の仕様	プロンプトあたりの画像の最大数 3,600 動画の長さの上限 1 時間音声の最大長約 9.5 時間
レート制限^[**]	無料: 15 RPM 100 万 TPM 1,500 RPD Pay-as-you-go: 2,000 RPM 400 万 TPM
の機能	システム指示サポート対象 JSON モードサポート対象 JSON スキーマサポート対象調整可能な安全設定サポート対象キャッシュ保存サポート対象チューニングサポート対象関数呼び出しサポート対象コードの実行サポート対象
バージョン	詳細については、モデルバージョンパターンをご覧ください。最新: `gemini-1.5-flash-latest` 最新の安定版: `gemini-1.5-flash` 安定版: `gemini-1.5-flash-001` `gemini-1.5-flash-002` 試験運用版: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
最終更新日	2024 年 9 月

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B は、低インテリジェンスタスク向けに設計された小型モデルです。

AI Studio で試す

モデルの詳細

プロパティ	説明
モデルコード	`models/gemini-1.5-flash-8b`
: サポートされているデータ型	入力音声、画像、動画、テキスト出力テキスト
トークンの上限^[*]	入力トークンの上限 1,048,576 出力トークンの上限 8,192
音声/映像の仕様	プロンプトあたりの画像の最大数 3,600 動画の長さの上限 1 時間音声の最大長約 9.5 時間
レート制限^[**]	無料: 15 RPM 100 万 TPM 1,500 RPD Pay-as-you-go: 4,000 RPM 400 万 TPM
の機能	システム指示サポート対象 JSON モードサポート対象 JSON スキーマサポート対象調整可能な安全設定サポート対象キャッシュ保存サポート対象チューニングサポート対象関数呼び出しサポート対象コードの実行サポート対象
バージョン	詳細については、モデルバージョンパターンをご覧ください。最新: `gemini-1.5-flash-8b-latest` 最新の安定版: `gemini-1.5-flash-8b` 安定版: `gemini-1.5-flash-8b-001`
最終更新日	2024 年 10 月

Gemini 1.5 Pro

Gemini 1.5 Pro は、幅広い推論タスクに最適化された中規模のマルチモーダルモデルです。1.5 Pro では、2 時間の動画、19 時間の音声、60,000 行のコードを含むコードベース、2,000 ページのテキストなど、大量のデータを一度に処理できます。

AI Studio で試す

モデルの詳細

プロパティ	説明
モデルコード	`models/gemini-1.5-pro`
: サポートされているデータ型	入力音声、画像、動画、テキスト出力テキスト
トークンの上限^[*]	入力トークンの上限 2,097,152 出力トークンの上限 8,192
音声/映像の仕様	プロンプトあたりの画像の最大数 7,200 動画の長さの上限 2 時間音声の最大長約 19 時間
レート制限^[**]	無料: 2 RPM 32,000 TPM 50 RPD Pay-as-you-go: 1,000 RPM 400 万 TPM
の機能	システム指示サポート対象 JSON モードサポート対象 JSON スキーマサポート対象調整可能な安全設定サポート対象キャッシュ保存サポート対象チューニングサポート対象外関数呼び出しサポート対象コードの実行サポート対象
バージョン	詳細については、モデルバージョンパターンをご覧ください。最新: `gemini-1.5-pro-latest` 最新の安定版: `gemini-1.5-pro` 安定版: `gemini-1.5-pro-001` `gemini-1.5-pro-002` 試験運用版: `gemini-1.5-pro-exp-0827`
最終更新日	2024 年 9 月

Gemini 1.0 Pro（非推奨）

Gemini 1.0 Pro は、マルチターンテキストとコードチャット、コード生成などのタスクを処理する NLP モデルです。

AI Studio で試す

モデルの詳細

プロパティ	説明
モデルコード	`models/gemini-1.0-pro`
: サポートされているデータ型	入力テキスト出力テキスト
レート制限^[**]	無料: 15 RPM 32,000 TPM 1,500 RPD Pay-as-you-go: 360 RPM 120,000 TPM 30,000 RPD
の機能	システム指示サポート対象外 JSON モードサポート対象外 JSON スキーマサポート対象外調整可能な安全設定サポート対象キャッシュ保存サポート対象外チューニングサポート対象関数呼び出しサポート対象関数呼び出しの構成サポート対象外コードの実行サポート対象外
バージョン	最新: `gemini-1.0-pro-latest` 最新の安定版: `gemini-1.0-pro` 安定版: `gemini-1.0-pro-001`
最終更新日	2024 年 2 月

注: gemini-pro は gemini-1.0-pro のエイリアスです。

テキストエンベディングとエンベディング

テキストエンベディング

テキストエンベディングは、文字列の関連性を測定するために使用され、多くの AI アプリケーションで広く使用されています。

text-embedding-004 は、標準の MTEB エンベディングベンチマークで、同等のディメンションを持つ既存のモデルよりも優れた検索パフォーマンスを達成し、優れたパフォーマンスを発揮します。

モデルの詳細

プロパティ	説明
モデルコード	Gemini API `models/text-embedding-004`
: サポートされているデータ型	入力テキスト出力テキストエンベディング
トークンの上限^[*]	入力トークンの上限 2,048 出力ディメンションのサイズ 768
レート制限^[**]	1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定	サポート対象外
最終更新日	2024 年 4 月

埋め込み

エンベディングモデルを使用して、入力テキストのテキストエンベディングを生成できます。

エンベディングモデルは、最大 2,048 トークンのテキストに対して 768 次元のエンベディングを作成するように最適化されています。

エンベディングモデルの詳細

プロパティ	説明
モデルコード	`models/embedding-001`
: サポートされているデータ型	入力テキスト出力テキストエンベディング
トークンの上限^[*]	入力トークンの上限 2,048 出力ディメンションのサイズ 768
レート制限^[**]	1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定	サポート対象外
最終更新日	2023 年 12 月

AQA

AQA モデルを使用すると、ドキュメント、コーパス、または一連のパラグラフに対して属性付き質問応答（AQA）関連のタスクを実行できます。AQA モデルは、指定されたソースに基づく質問に対する回答と、回答可能な確率の推定値を返します。

モデルの詳細

プロパティ	説明
モデルコード	`models/aqa`
: サポートされているデータ型	入力テキスト出力テキスト
サポートされている言語	英語
トークンの上限^[*]	入力トークンの上限 7,168 出力トークンの上限 1,024
レート制限^[**]	1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定	サポート対象
最終更新日	2023 年 12 月

これらのモデルのバリエーションの機能については、例をご覧ください。

[*] Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ～ 80 ワード（英語）です。

[**] RPM: 1 分あたりのリクエスト数
TPM: 1 分あたりのトークン数
RPD: 1 日あたりのリクエスト数
TPD: 1 日あたりのトークン数

容量の制限により、指定された最大レートの上限は保証されません。

モデルバージョン名のパターン

Gemini モデルは、プレビュー版または安定版のいずれかを使用できます。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。

最新: 指定された生成とバリエーションのモデルの最先端バージョンを参照します。基盤となるモデルは定期的に更新され、プレビューバージョンである場合があります。このエイリアスは、探索的テストアプリとプロトタイプでのみ使用してください。

最新バージョンを指定するには、<model>-<generation>-<variation>-latest というパターンを使用します。例: gemini-1.0-pro-latest
最新の安定版: 指定されたモデルの生成とバリエーション用にリリースされた最新の安定版を参照します。

最新の安定版を指定するには、<model>-<generation>-<variation> というパターンを使用します。例: gemini-1.0-pro
安定版: 特定の安定版モデルを指します。安定モデルは変更されません。ほとんどの本番環境アプリでは、特定の安定したモデルを使用する必要があります。

安定版を指定するには、<model>-<generation>-<variation>-<version> の形式を使用します。例: gemini-1.0-pro-001
試験運用版: 利用規約で定義されているように、プレビュー版で利用可能な試験運用版モデルを指します。つまり、本番環境での使用は想定されていません。試験運用版モデルは、フィードバックの収集、最新アップデートをデベロッパーに迅速に提供すること、Google のイノベーションのペースを強調することを目的としています。試験運用版のリリースから得られた知見は、モデルをより広範にリリースする方法に反映されます。試験運用版モデルは、事前の通知なく別のモデルと置き換えられる可能性があります。試験運用版モデルは、将来的に安定版モデルになるとは限りません。

試験運用版を指定するには、<model>-<generation>-<variation>-<version> というパターンを使用します。例: gemini-1.5-pro-exp-0827

対応言語

Gemini モデルは、次の言語で動作するようにトレーニングされています。

アラビア語（ar）
ベンガル語（bn）
ブルガリア語（bg）
中国語（簡体および繁体）（zh）
クロアチア語（hr）
チェコ語（cs）
デンマーク語（da）
オランダ語（nl）
英語（en）
エストニア語（et）
フィンランド語（fi）
フランス語（fr）
ドイツ語（de）
ギリシャ語（el）
ヘブライ語（iw）
ヒンディー語（hi）
ハンガリー語（hu）
インドネシア語（id）
イタリア語（it）
日本語（ja）
韓国語（ko）
ラトビア語（lv）
リトアニア語（lt）
ノルウェー語（no）
ポーランド語（pl）
ポルトガル語（pt）
ルーマニア語（ro）
ロシア語（ru）
セルビア語（sr）
スロバキア語（sk）
スロベニア語（sl）
スペイン語（es）
スワヒリ語（sw）
スウェーデン語（sv）
タイ語（th）
トルコ語（tr）
ウクライナ語（uk）
ベトナム語（vi）

双子座モデル

モデル バリエーション

Gemini 1.5 Flash

モデルの詳細

Gemini 1.5 Flash-8B

モデルの詳細

Gemini 1.5 Pro

モデルの詳細

Gemini 1.0 Pro（非推奨）

モデルの詳細

テキスト エンベディングとエンベディング

テキスト エンベディング

モデルの詳細

埋め込み

エンベディング モデルの詳細

AQA

モデルの詳細

モデル バージョン名のパターン

対応言語

モデルバリエーション

テキストエンベディングとエンベディング

テキストエンベディング

エンベディングモデルの詳細

モデルバージョン名のパターン