2.0 Flash
次世代の機能と強化された機能を備えた最新のマルチモーダル モデル
- 音声、画像、動画、テキストを入力する - テキスト、画像、音声のレスポンスを取得する
- Multimodal Live API による低レイテンシの会話型インタラクション機能を備えています。
モデル バリエーション
Gemini API には、特定のユースケース用に最適化されたさまざまなモデルが用意されています。利用可能な Gemini のバリエーションの概要は次のとおりです。
モデル バリエーション | 入力 | 出力 | 最適な用途 |
---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash-exp |
音声、画像、動画、テキスト | テキスト、画像(近日提供予定)、音声(近日提供予定) | 次世代の特徴、速度、マルチモーダル生成によるさまざまなタスク |
Gemini 1.5 Flash
gemini-1.5-flash |
音声、画像、動画、テキスト | テキスト | さまざまなタスクで高速で汎用性の高いパフォーマンスを実現 |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
音声、画像、動画、テキスト | テキスト | 大量の低インテリジェンス タスク |
Gemini 1.5 Pro
gemini-1.5-pro |
音声、画像、動画、テキスト | テキスト | より高度なインテリジェンスを必要とする複雑な推論タスク |
(2025 年 2 月 15 日をもってサポート終了)Gemini 1.0 Pro
gemini-1.0-pro |
テキスト | テキスト | 自然言語タスク、マルチターン テキストとコードチャット、コード生成 |
テキスト エンベディング
text-embedding-004 |
テキスト | テキスト エンベディング | テキスト文字列の関連性の測定 |
AQA
aqa |
テキスト | テキスト | 質問にソースに基づく回答を提供すること |
(試験運用版)Gemini 2.0 Flash
Gemini 2.0 Flash は、優れた速度、ネイティブ ツールの使用、マルチモーダル生成、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と強化された機能を提供します。Gemini 2.0 Flash の詳細については、概要ページをご覧ください。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-2.0-flash-exp |
: サポートされるデータ型 |
入力 音声、画像、動画、テキスト 出力 音声(近日提供予定)、画像(近日提供予定)、テキスト |
[*] | トークンの上限
入力トークンの上限 1,048,576 出力トークンの上限 8,192 |
[**] | レート制限
|
の機能 |
構造化出力 サポート対象 キャッシュ保存 サポート対象外 チューニング サポート対象外 関数呼び出し サポート対象 コードの実行 サポート対象 検索 サポート対象 画像生成 サポート対象 ネイティブ ツールの使用 サポート対象 音声の生成 サポート対象 |
バージョン |
|
最終更新日 | 2024 年 12 月 |
Gemini 1.5 Flash
Gemini 1.5 Flash は、さまざまなタスクにスケーリングできる、高速で汎用性の高いマルチモーダル モデルです。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-flash |
: サポートされるデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 1,048,576 出力トークンの上限 8,192 |
音声/映像の仕様 |
プロンプトあたりの画像の最大数 3,600 動画の長さの上限 1 時間 音声の最大長 約 9.5 時間 |
[**] | レート制限
|
の機能 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象 関数呼び出し サポート対象 コードの実行 サポート対象 双方向ストリーミング サポート対象外 |
バージョン |
|
最終更新日 | 2024 年 9 月 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B は、低インテリジェンス タスク向けに設計された小型モデルです。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-flash-8b |
: サポートされるデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 1,048,576 出力トークンの上限 8,192 |
音声/映像の仕様 |
プロンプトあたりの画像の最大数 3,600 動画の長さの上限 1 時間 音声の最大長 約 9.5 時間 |
[**] | レート制限
|
の機能 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象 関数呼び出し サポート対象 コードの実行 サポート対象 双方向ストリーミング サポート対象外 |
バージョン |
|
最終更新日 | 2024 年 10 月 |
Gemini 1.5 Pro
Gemini 1.5 Pro は、幅広い推論タスクに最適化された中規模のマルチモーダル モデルです。1.5 Pro では、2 時間の動画、19 時間の音声、60,000 行のコードを含むコードベース、2,000 ページのテキストなど、大量のデータを一度に処理できます。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-pro |
: サポートされるデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 2,097,152 出力トークンの上限 8,192 |
音声/映像の仕様 |
プロンプトあたりの画像の最大数 7,200 動画の長さの上限 2 時間 音声の最大長 約 19 時間 |
[**] | レート制限
|
の機能 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象外 関数呼び出し サポート対象 コードの実行 サポート対象 双方向ストリーミング サポート対象外 |
バージョン |
|
最終更新日 | 2024 年 9 月 |
(非推奨)Gemini 1.0 Pro
Gemini 1.0 Pro は、マルチターン テキストとコードチャット、コード生成などのタスクを処理する NLP モデルです。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.0-pro |
: サポートされるデータ型 |
入力 テキスト 出力 テキスト |
[**] | レート制限
|
の機能 |
システム指示 サポート対象外 JSON モード サポート対象外 JSON スキーマ サポート対象外 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象外 チューニング サポート対象 関数呼び出し サポート対象 関数呼び出しの構成 サポート対象外 コードの実行 サポート対象外 双方向ストリーミング サポート対象外 |
バージョン |
|
最終更新日 | 2024 年 2 月 |
テキスト エンベディングとエンベディング
テキスト エンベディング
テキスト エンベディングは、文字列の関連性を測定するために使用され、多くの AI アプリケーションで広く使用されています。
text-embedding-004
は、標準の MTEB エンベディング ベンチマークで、同等のディメンションを持つ既存のモデルよりも優れた検索パフォーマンスを実現し、優れた結果を達成しています。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード |
Gemini API
|
: サポートされるデータ型 |
入力 テキスト 出力 テキスト エンベディング |
[*] | トークンの上限
入力トークンの上限 2,048 出力ディメンションのサイズ 768 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
された調整可能な安全性設定 | サポート対象外 |
最終更新日 | 2024 年 4 月 |
埋め込み
エンベディング モデルを使用して、入力テキストのテキスト エンベディングを生成できます。
エンベディング モデルは、最大 2,048 トークンのテキストに対して 768 次元のエンベディングを作成するように最適化されています。
エンベディング モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード |
models/embedding-001
|
: サポートされるデータ型 |
入力 テキスト 出力 テキスト エンベディング |
[*] | トークンの上限
入力トークンの上限 2,048 出力ディメンションのサイズ 768 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
された調整可能な安全性設定 | サポート対象外 |
最終更新日 | 2023 年 12 月 |
AQA
AQA モデルを使用すると、ドキュメント、コーパス、または一連のパラグラフに対して属性付き質問応答(AQA)関連のタスクを実行できます。AQA モデルは、指定されたソースに基づく質問に対する回答と、回答可能な確率の推定値を返します。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/aqa |
: サポートされるデータ型 |
入力 テキスト 出力 テキスト |
サポートされている言語 | 英語 |
[*] | トークンの上限
入力トークンの上限 7,168 出力トークンの上限 1,024 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
された調整可能な安全性設定 | サポート対象 |
最終更新日 | 2023 年 12 月 |
これらのモデルのバリエーションの機能については、例をご覧ください。
[*] Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 ワード(英語)です。
[**] RPM: 1 分あたりのリクエスト数
TPM: 1 分あたりのトークン数
RPD: 1 日あたりのリクエスト数
TPD: 1 日あたりのトークン数
容量の制限により、指定された最大レートの上限は保証されません。
モデル バージョン名のパターン
Gemini モデルは、プレビュー版または安定版のいずれかを使用できます。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。
最新: 指定した生成とバリエーションのモデルの最先端バージョンを参照します。基盤となるモデルは定期的に更新され、プレビュー バージョンである可能性があります。このエイリアスは、探索的テストアプリとプロトタイプでのみ使用してください。
最新バージョンを指定するには、
<model>-<generation>-<variation>-latest
というパターンを使用します。例:gemini-1.0-pro-latest
最新の安定版: 指定されたモデルの生成とバリエーション用にリリースされた最新の安定版を参照します。
最新の安定版を指定するには、
<model>-<generation>-<variation>
というパターンを使用します。例:gemini-1.0-pro
安定版: 特定の安定版モデルを参照します。安定モデルは変更されません。ほとんどの本番環境アプリでは、特定の安定したモデルを使用する必要があります。
安定版を指定するには、
<model>-<generation>-<variation>-<version>
の形式を使用します。例:gemini-1.0-pro-001
試験運用版: 利用規約で定義されているように、プレビュー版で利用可能な試験運用版モデルを指します。つまり、本番環境での使用は想定されていません。Google は試験運用版モデルをリリースしてフィードバックを収集し、最新のアップデートをデベロッパーに迅速に提供し、Google のイノベーションのペースをアピールしています。試験運用版リリースから得た学びを活かして、モデルの提供対象ユーザーを拡大する予定です。試験運用版モデルは、事前の通知なく別のモデルと置き換えられる可能性があります。試験運用版モデルは、将来的に安定版モデルになるとは限りません。
試験運用版を指定するには、
<model>-<generation>-<variation>-<version>
というパターンを使用します。例:gemini-exp-1121
対応言語
Gemini モデルは、次の言語で動作するようにトレーニングされています。
- アラビア語(
ar
) - ベンガル語(
bn
) - ブルガリア語(
bg
) - 中国語(簡体および繁体)(
zh
) - クロアチア語(
hr
) - チェコ語(
cs
) - デンマーク語(
da
) - オランダ語(
nl
) - 英語(
en
) - エストニア語(
et
) - フィンランド語(
fi
) - フランス語(
fr
) - ドイツ語(
de
) - ギリシャ語(
el
) - ヘブライ語(
iw
) - ヒンディー語(
hi
) - ハンガリー語(
hu
) - インドネシア語(
id
) - イタリア語(
it
) - 日本語(
ja
) - 韓国語(
ko
) - ラトビア語(
lv
) - リトアニア語(
lt
) - ノルウェー語(
no
) - ポーランド語(
pl
) - ポルトガル語(
pt
) - ルーマニア語(
ro
) - ロシア語(
ru
) - セルビア語(
sr
) - スロバキア語(
sk
) - スロベニア語(
sl
) - スペイン語(
es
) - スワヒリ語(
sw
) - スウェーデン語(
sv
) - タイ語(
th
) - トルコ語(
tr
) - ウクライナ語(
uk
) - ベトナム語(
vi
)