Gemini モデル

モデル バリエーション

Gemini API には、特定のユースケース用に最適化されたさまざまなモデルが用意されています。利用可能な Gemini のバリエーションの概要は次のとおりです。

モデル バリエーション 入力 出力 最適な用途
Gemini 2.5 Flash プレビュー版 04-17
gemini-2.5-flash-preview-04-17
音声、画像、動画、テキスト テキスト 適応的思考、費用対効果
Gemini 2.5 Pro プレビュー
gemini-2.5-pro-preview-03-25
音声、画像、動画、テキスト テキスト 思考と推論の強化、マルチモーダル理解、高度なコーディングなど
Gemini 2.0 Flash
gemini-2.0-flash
音声、画像、動画、テキスト テキスト、画像(試験運用版)、音声(近日提供予定) 次世代の機能、速度、思考、リアルタイム ストリーミング、マルチモーダル生成
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
音声、画像、動画、テキスト テキスト 費用対効果と低レイテンシ
Gemini 1.5 Flash
gemini-1.5-flash
音声、画像、動画、テキスト テキスト さまざまなタスクで高速で汎用性の高いパフォーマンスを実現
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
音声、画像、動画、テキスト テキスト 大規模でインテリジェンスが低いタスク
Gemini 1.5 Pro
gemini-1.5-pro
音声、画像、動画、テキスト テキスト より多くのインテリジェンスを必要とする複雑な推論タスク
Gemini エンベディング
gemini-embedding-exp
テキスト テキスト エンベディング テキスト文字列の関連性の測定
Imagen 3
imagen-3.0-generate-002
テキスト 画像 Google の最も高度な画像生成モデル
Veo 2
veo-2.0-generate-001
テキスト、画像 動画 高画質動画の生成
Gemini 2.0 Flash ライブ
gemini-2.0-flash-live-001
音声、動画、テキスト テキスト、音声 低レイテンシの双方向の音声と動画によるやり取り

各モデルのレート制限は、レート制限ページで確認できます。

価格とパフォーマンスの点で最適なモデルで、幅広い機能を提供します。Gemini 2.5 Flash は試験運用版 / プレビュー版のモデルであるため、レート制限がより厳しくなっています。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.5-flash-preview-04-17
: サポートされるデータタイプ

入力

テキスト、画像、動画、音声

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

65,536

の機能

音声の生成

サポート対象外

キャッシュ保存

サポート対象外

コードの実行

サポート対象

関数呼び出し

サポート対象

画像生成

サポート対象外

検索

サポート対象

構造化出力

サポート対象

思考

サポート対象

チューニング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • プレビュー: gemini-2.5-flash-preview-04-17
最終更新日 2025 年 4 月
ナレッジ カットオフ 2025 年 1 月

Gemini 2.5 Pro は、コード、数学、STEM の複雑な問題の推論や、長いコンテキストを使用した大規模なデータセット、コードベース、ドキュメントの分析が可能な、最先端の思考モデルです。Gemini 2.5 Pro は試験運用版 / プレビュー版のモデルであるため、レート制限がより厳しくなっています。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード 有料: gemini-2.5-pro-preview-03-25、試験運用版: gemini-2.5-pro-exp-03-25
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

65,536

の機能

構造化出力

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

検索によるグラウンディング

サポート対象

画像生成

サポート対象外

音声の生成

サポート対象外

Live API

サポート対象外

思考

サポート対象

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • プレビュー: gemini-2.5-pro-preview-03-25
  • 試験運用版: gemini-2.5-pro-exp-03-25
最終更新日 2025 年 3 月
ナレッジ カットオフ 2025 年 1 月

Gemini 2.0 Flash は、優れた速度、ネイティブ ツールの使用、マルチモーダルの生成、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と強化された機能を提供します。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.0-flash
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト、画像(試験運用版)、音声(近日提供予定)

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

の機能

構造化出力

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

検索

サポート対象

画像生成

試験運用版

音声の生成

近日提供予定

Live API

サポート対象

思考

試験運用版

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-2.0-flash
  • 安定版: gemini-2.0-flash-001
  • 試験運用版: gemini-2.0-flash-exp*gemini-2.0-flash-exp-image-generation* は同じ基盤モデルを参照します
  • gemini-2.0-flash-exp-image-generation は現在、欧州、中東、アフリカの多くの国でサポートされていません

最終更新日 2025 年 2 月
ナレッジ カットオフ 2024 年 8 月

費用対効果と低レイテンシを重視して最適化された Gemini 2.0 Flash モデル。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.0-flash-lite
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

の機能

構造化出力

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象外

検索

サポート対象外

画像生成

サポート対象外

音声の生成

サポート対象外

Live API

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-2.0-flash-lite
  • 安定版: gemini-2.0-flash-lite-001
最終更新日 2025 年 2 月
ナレッジ カットオフ 2024 年 8 月

Gemini 1.5 Flash は、さまざまなタスクにスケーリングできる、高速で汎用性の高いマルチモーダル モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の長さの上限

1 時間

音声の最大長

約 9.5 時間

の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象

関数呼び出し

サポート対象

コードの実行

サポート対象

Live API

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-flash-latest
  • 最新の安定版: gemini-1.5-flash
  • 安定版:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
最終更新日 2024 年 9 月

Gemini 1.5 Flash-8B は、低インテリジェンス タスク向けに設計された小型モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash-8b
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の長さの上限

1 時間

音声の最大長

約 9.5 時間

の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象

関数呼び出し

サポート対象

コードの実行

サポート対象

Live API

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-flash-8b-latest
  • 最新の安定版: gemini-1.5-flash-8b
  • 安定版:
    • gemini-1.5-flash-8b-001
最終更新日 2024 年 10 月

Google 最先端の Gemini モデルである Gemini 2.5 Pro プレビューをお試しください。

Gemini 1.5 Pro は、さまざまな推論タスクに最適化された中規模のマルチモーダル モデルです。1.5 Pro では、2 時間の動画、19 時間の音声、60,000 行のコードを含むコードベース、2,000 ページのテキストなど、大量のデータを一度に処理できます。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-pro
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

2,097,152

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

7,200

動画の長さの上限

2 時間

音声の最大長

約 19 時間

の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

Live API

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-pro-latest
  • 最新の安定版: gemini-1.5-pro
  • 安定版:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
最終更新日 2024 年 9 月

Imagen 3 は Google の最高品質のテキスト画像変換モデルであり、以前のモデルよりもディテールが鮮明で、照明が豊かになり、演出の妨げになるアーティファクトの数も抑えられています。

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

imagen-3.0-generate-002

: サポートされるデータタイプ

入力

テキスト

出力

画像

トークンの上限[*]

入力トークンの上限

なし

出力画像

最大 4 個

最終更新日 2025 年 2 月

Veo 2 は、Google の高品質なテキストと画像から動画への変換モデルです。詳細な動画を生成でき、プロンプトの芸術的なニュアンスを捉えることができます。

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

veo-2.0-generate-001

: サポートされるデータタイプ

入力

テキスト、画像

出力

動画

の上限

テキスト入力

なし

画像入力

任意の画像解像度とアスペクト比、ファイルサイズは最大 20 MB

動画を出力する

最大 2 個

最終更新日 2025 年 4 月

Gemini 2.0 Flash Live モデルは Live API と連携して、Gemini との双方向の音声と動画による低レイテンシのやり取りを可能にします。このモデルは、テキスト、音声、および動画入力を処理でき、テキストおよび音声出力を生成できます。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.0-flash-live-001
: サポートされるデータタイプ

入力

音声、動画、テキスト

出力

テキスト、音声

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

の機能

構造化出力

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

検索

サポート対象

画像生成

サポート対象外

音声の生成

サポート対象

思考

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • プレビュー: gemini-2.0-flash-live-001
最終更新日 2025 年 4 月
ナレッジ カットオフ 2024 年 8 月

Gemini embedding は、コード、多言語、検索など、多くの重要なディメンションでSOTA のパフォーマンスを実現します。 Gemini エンベディングは試験運用版であるため、レートの上限がより厳しく制限されています。

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

gemini-embedding-exp-03-07

: サポートされるデータタイプ

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

8,192

出力ディメンションのサイズ

伸縮自在、サポート: 3072、1536、768

最終更新日 2025 年 3 月

テキスト エンベディング

最新のパフォーマンスを実現する新しい Gemini エンベディング モデルの試験運用版をお試しください。

テキスト エンベディングは、文字列の関連性を測定するために使用され、多くの AI アプリケーションで広く使用されています。

text-embedding-004 は、標準の MTEB エンベディング ベンチマークで、同等のディメンションを持つ既存のモデルよりも優れた検索パフォーマンスを達成し、優れたパフォーマンスを発揮します。

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

models/text-embedding-004

: サポートされるデータタイプ

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンションのサイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象外
最終更新日 2024 年 4 月

埋め込み

エンベディング モデルを使用して、入力テキストのテキスト エンベディングを生成できます。

エンベディング モデルは、最大 2,048 トークンのテキストに対して 768 次元のエンベディングを作成するように最適化されています。

エンベディング モデルの詳細
プロパティ 説明
モデルコード models/embedding-001
: サポートされるデータタイプ

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンションのサイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象外
最終更新日 2023 年 12 月

AQA モデルを使用すると、ドキュメント、コーパス、または一連のパラグラフに対して属性付き質問応答(AQA)関連のタスクを実行できます。AQA モデルは、指定されたソースに基づく質問に対する回答と、回答可能な確率の推定値を返します。

モデルの詳細

プロパティ 説明
モデルコード models/aqa
: サポートされるデータタイプ

入力

テキスト

出力

テキスト

サポートされている言語 英語
トークンの上限[*]

入力トークンの上限

7,168

出力トークンの上限

1,024

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象
最終更新日 2023 年 12 月

これらのモデルのバリエーションの機能については、をご覧ください。

[*] Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 ワード(英語)です。

モデル バージョン名のパターン

Gemini モデルは、プレビュー版安定版、試験運用版のいずれかでご利用いただけます。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。

  • 最新の安定版: 指定されたモデルの生成とバリエーション用にリリースされた最新の安定版を参照します。

    最新の安定版を指定するには、<model>-<generation>-<variation> というパターンを使用します。例: gemini-2.0-flash

  • 安定版: 特定の安定版モデルを参照します。通常、安定したモデルは変更されません。ほとんどの本番環境アプリでは、特定の安定したモデルを使用する必要があります。

    安定版を指定するには、<model>-<generation>-<variation>-<version> の形式を使用します。例: gemini-2.0-flash-001

  • プレビュー: 本番環境での使用には適さない可能性があるプレビューモデルを指します。レート制限がより厳しく、課金が有効になっている場合があります。

    プレビュー バージョンを指定するには、<model>-<generation>-<variation>-<version> の形式を使用します。例: gemini-2.5-pro-preview-03-25

  • 試験運用版: 本番環境での使用には適さない可能性があり、より制限の厳しいレート制限が適用される試験運用版モデルを指します。試験運用版モデルは、フィードバックを収集し、最新のアップデートをデベロッパーに迅速に提供するためにリリースされます。

    試験運用版を指定するには、<model>-<generation>-<variation>-<version> の形式を使用します。例: gemini-2.0-pro-exp-02-05

試験運用版モデル

Gemini API には、安定版モデルに加えて試験運用版モデルも用意されています。試験運用版モデルは、本番環境での使用には適さず、より制限の厳しいレート制限が適用される場合があります。

Google は、フィードバックの収集、最新のアップデートを迅速にデベロッパーに提供すること、Google のイノベーションのペースを強調することを目的として、試験運用版モデルをリリースしています。試験運用版リリースから得た情報を、モデルの広範なリリースに反映させます。試験運用版モデルは、事前の通知なく別のモデルと置き換わる可能性があります。試験運用版モデルは、将来的に安定版モデルになるとは限りません。

以前の試験運用版モデル

新しいバージョンまたは安定版が利用可能になると、試験運用版モデルは削除され、置き換えられます。以前リリースされた試験運用版モデルは、次のセクションで、置き換えバージョンとともに確認できます。

モデルコード ベースモデル 交換用バージョン
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

サポートされている言語

Gemini モデルは、次の言語で動作するようにトレーニングされています。

  • アラビア語(ar
  • ベンガル語(bn
  • ブルガリア語(bg
  • 中国語(簡体および繁体)(zh
  • クロアチア語(hr
  • チェコ語(cs
  • デンマーク語(da
  • オランダ語(nl
  • 英語(en
  • エストニア語(et
  • フィンランド語(fi
  • フランス語(fr
  • ドイツ語(de
  • ギリシャ語(el
  • ヘブライ語(iw
  • ヒンディー語(hi
  • ハンガリー語(hu
  • インドネシア語(id
  • イタリア語(it
  • 日本語(ja
  • 韓国語(ko
  • ラトビア語(lv
  • リトアニア語(lt
  • ノルウェー語(no
  • ポーランド語(pl
  • ポルトガル語(pt
  • ルーマニア語(ro
  • ロシア語(ru
  • セルビア語(sr
  • スロバキア語(sk
  • スロベニア語(sl
  • スペイン語(es
  • スワヒリ語(sw
  • スウェーデン語(sv
  • タイ語(th
  • トルコ語(tr
  • ウクライナ語(uk
  • ベトナム語(vi