Gemini モデル

モデル バリエーション

Gemini API には、特定のユースケース用に最適化されたさまざまなモデルが用意されています。利用可能な Gemini のバリエーションの概要は次のとおりです。

モデル バリエーション 入力 出力 最適な用途
Gemini 2.0 Flash
gemini-2.0-flash-exp
音声、画像、動画、テキスト テキスト、画像(近日提供予定)、音声(近日提供予定) 次世代の特徴、速度、マルチモーダル生成によるさまざまなタスク
Gemini 1.5 Flash
gemini-1.5-flash
音声、画像、動画、テキスト テキスト さまざまなタスクで高速で汎用性の高いパフォーマンスを実現
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
音声、画像、動画、テキスト テキスト 大量の低インテリジェンス タスク
Gemini 1.5 Pro
gemini-1.5-pro
音声、画像、動画、テキスト テキスト より高度なインテリジェンスを必要とする複雑な推論タスク
(2025 年 2 月 15 日をもってサポート終了)Gemini 1.0 Pro
gemini-1.0-pro
テキスト テキスト 自然言語タスク、マルチターン テキストとコードチャット、コード生成
テキスト エンベディング
text-embedding-004
テキスト テキスト エンベディング テキスト文字列の関連性の測定
AQA
aqa
テキスト テキスト 質問にソースに基づく回答を提供すること

(試験運用版)Gemini 2.0 Flash

Gemini 2.0 Flash は、優れた速度、ネイティブ ツールの使用、マルチモーダル生成、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と強化された機能を提供します。Gemini 2.0 Flash の詳細については、概要ページをご覧ください。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.0-flash-exp
: サポートされるデータ型

入力

音声、画像、動画、テキスト

出力

音声(近日提供予定)、画像(近日提供予定)、テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

レート制限[**]
  • 10 RPM
  • 400 万 TPM
  • 1,500 RPD
の機能

構造化出力

サポート対象

キャッシュ保存

サポート対象外

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

検索

サポート対象

画像生成

サポート対象

ネイティブ ツールの使用

サポート対象

音声の生成

サポート対象

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-2.0-flash-exp
最終更新日 2024 年 12 月

Gemini 1.5 Flash

Gemini 1.5 Flash は、さまざまなタスクにスケーリングできる、高速で汎用性の高いマルチモーダル モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash
: サポートされるデータ型

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の長さの上限

1 時間

音声の最大長

約 9.5 時間

レート制限[**]
無料:
  • 15 RPM
  • 100 万 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 2,000 RPM
  • 400 万 TPM
の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象

関数呼び出し

サポート対象

コードの実行

サポート対象

双方向ストリーミング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-flash-latest
  • 最新の安定版: gemini-1.5-flash
  • 安定版:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
最終更新日 2024 年 9 月

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B は、低インテリジェンス タスク向けに設計された小型モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash-8b
: サポートされるデータ型

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の長さの上限

1 時間

音声の最大長

約 9.5 時間

レート制限[**]
無料:
  • 15 RPM
  • 100 万 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 4,000 RPM
  • 400 万 TPM
の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象

関数呼び出し

サポート対象

コードの実行

サポート対象

双方向ストリーミング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-flash-8b-latest
  • 最新の安定版: gemini-1.5-flash-8b
  • 安定版:
    • gemini-1.5-flash-8b-001
最終更新日 2024 年 10 月

Gemini 1.5 Pro

Gemini 1.5 Pro は、幅広い推論タスクに最適化された中規模のマルチモーダル モデルです。1.5 Pro では、2 時間の動画、19 時間の音声、60,000 行のコードを含むコードベース、2,000 ページのテキストなど、大量のデータを一度に処理できます。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-pro
: サポートされるデータ型

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

2,097,152

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

7,200

動画の長さの上限

2 時間

音声の最大長

約 19 時間

レート制限[**]
無料:
  • 2 RPM
  • 32,000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1,000 RPM
  • 400 万 TPM
の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

双方向ストリーミング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-pro-latest
  • 最新の安定版: gemini-1.5-pro
  • 安定版:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
最終更新日 2024 年 9 月

(非推奨)Gemini 1.0 Pro

Gemini 1.0 Pro は、マルチターン テキストとコードチャット、コード生成などのタスクを処理する NLP モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.0-pro
: サポートされるデータ型

入力

テキスト

出力

テキスト

レート制限[**]
無料:
  • 15 RPM
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
の機能

システム指示

サポート対象外

JSON モード

サポート対象外

JSON スキーマ

サポート対象外

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象外

チューニング

サポート対象

関数呼び出し

サポート対象

関数呼び出しの構成

サポート対象外

コードの実行

サポート対象外

双方向ストリーミング

サポート対象外

バージョン
  • 最新: gemini-1.0-pro-latest
  • 最新の安定版: gemini-1.0-pro
  • 安定版: gemini-1.0-pro-001
最終更新日 2024 年 2 月

テキスト エンベディングとエンベディング

テキスト エンベディング

テキスト エンベディングは、文字列の関連性を測定するために使用され、多くの AI アプリケーションで広く使用されています。

text-embedding-004 は、標準の MTEB エンベディング ベンチマークで、同等のディメンションを持つ既存のモデルよりも優れた検索パフォーマンスを実現し、優れた結果を達成しています。

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

models/text-embedding-004

: サポートされるデータ型

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンションのサイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象外
最終更新日 2024 年 4 月

埋め込み

エンベディング モデルを使用して、入力テキストのテキスト エンベディングを生成できます。

エンベディング モデルは、最大 2,048 トークンのテキストに対して 768 次元のエンベディングを作成するように最適化されています。

エンベディング モデルの詳細
プロパティ 説明
モデルコード models/embedding-001
: サポートされるデータ型

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンションのサイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象外
最終更新日 2023 年 12 月

AQA

AQA モデルを使用すると、ドキュメント、コーパス、または一連のパラグラフに対して属性付き質問応答(AQA)関連のタスクを実行できます。AQA モデルは、指定されたソースに基づく質問に対する回答と、回答可能な確率の推定値を返します。

モデルの詳細

プロパティ 説明
モデルコード models/aqa
: サポートされるデータ型

入力

テキスト

出力

テキスト

サポートされている言語 英語
トークンの上限[*]

入力トークンの上限

7,168

出力トークンの上限

1,024

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象
最終更新日 2023 年 12 月

これらのモデルのバリエーションの機能については、をご覧ください。

[*] Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 ワード(英語)です。

[**] RPM: 1 分あたりのリクエスト数
TPM: 1 分あたりのトークン数
RPD: 1 日あたりのリクエスト数
TPD: 1 日あたりのトークン数

容量の制限により、指定された最大レートの上限は保証されません。

モデル バージョン名のパターン

Gemini モデルは、プレビュー版または安定版のいずれかを使用できます。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。

  • 最新: 指定した生成とバリエーションのモデルの最先端バージョンを参照します。基盤となるモデルは定期的に更新され、プレビュー バージョンである可能性があります。このエイリアスは、探索的テストアプリとプロトタイプでのみ使用してください。

    最新バージョンを指定するには、<model>-<generation>-<variation>-latest というパターンを使用します。例: gemini-1.0-pro-latest

  • 最新の安定版: 指定されたモデルの生成とバリエーション用にリリースされた最新の安定版を参照します。

    最新の安定版を指定するには、<model>-<generation>-<variation> というパターンを使用します。例: gemini-1.0-pro

  • 安定版: 特定の安定版モデルを参照します。安定モデルは変更されません。ほとんどの本番環境アプリでは、特定の安定したモデルを使用する必要があります。

    安定版を指定するには、<model>-<generation>-<variation>-<version> の形式を使用します。例: gemini-1.0-pro-001

  • 試験運用版: 利用規約で定義されているように、プレビュー版で利用可能な試験運用版モデルを指します。つまり、本番環境での使用は想定されていません。Google は試験運用版モデルをリリースしてフィードバックを収集し、最新のアップデートをデベロッパーに迅速に提供し、Google のイノベーションのペースをアピールしています。試験運用版リリースから得た学びを活かして、モデルの提供対象ユーザーを拡大する予定です。試験運用版モデルは、事前の通知なく別のモデルと置き換えられる可能性があります。試験運用版モデルは、将来的に安定版モデルになるとは限りません。

    試験運用版を指定するには、<model>-<generation>-<variation>-<version> というパターンを使用します。例: gemini-exp-1121

対応言語

Gemini モデルは、次の言語で動作するようにトレーニングされています。

  • アラビア語(ar
  • ベンガル語(bn
  • ブルガリア語(bg
  • 中国語(簡体および繁体)(zh
  • クロアチア語(hr
  • チェコ語(cs
  • デンマーク語(da
  • オランダ語(nl
  • 英語(en
  • エストニア語(et
  • フィンランド語(fi
  • フランス語(fr
  • ドイツ語(de
  • ギリシャ語(el
  • ヘブライ語(iw
  • ヒンディー語(hi
  • ハンガリー語(hu
  • インドネシア語(id
  • イタリア語(it
  • 日本語(ja
  • 韓国語(ko
  • ラトビア語(lv
  • リトアニア語(lt
  • ノルウェー語(no
  • ポーランド語(pl
  • ポルトガル語(pt
  • ルーマニア語(ro
  • ロシア語(ru
  • セルビア語(sr
  • スロバキア語(sk
  • スロベニア語(sl
  • スペイン語(es
  • スワヒリ語(sw
  • スウェーデン語(sv
  • タイ語(th
  • トルコ語(tr
  • ウクライナ語(uk
  • ベトナム語(vi