1.5 Flash
ほとんどのタスクで優れたパフォーマンスを発揮する、最もバランスの取れたマルチモーダル モデル
- 音声、画像、動画、テキストを入力して、テキスト レスポンスを取得する
- コードの生成、データの抽出、テキストの編集など
- パフォーマンスと費用のバランスを取るタスクに最適
モデル バリエーション
Gemini API には、特定のユースケース用に最適化されたさまざまなモデルが用意されています。利用可能な Gemini のバリエーションの概要は次のとおりです。
モデル バリエーション | 入力 | 出力 | 最適な用途 |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
音声、画像、動画、テキスト | テキスト | さまざまなタスクで高速で汎用性の高いパフォーマンスを実現 |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
音声、画像、動画、テキスト | テキスト | 大量の低インテリジェンス タスク |
Gemini 1.5 Pro
gemini-1.5-pro |
音声、画像、動画、テキスト | テキスト | より高度なインテリジェンスを必要とする複雑な推論タスク |
Gemini 1.0 Pro(2025 年 2 月 15 日をもってサポート終了)
gemini-1.0-pro |
テキスト | テキスト | 自然言語タスク、マルチターン テキストとコードチャット、コード生成 |
テキスト エンベディング
text-embedding-004 |
テキスト | テキスト エンベディング | テキスト文字列の関連性の測定 |
AQA
aqa |
テキスト | テキスト | 質問にソースに基づく回答を提供すること |
Gemini 1.5 Flash
Gemini 1.5 Flash は、さまざまなタスク全体にスケーリングできる、高速で汎用性の高いマルチモーダル モデルです。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-flash |
: サポートされているデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 1,048,576 出力トークンの上限 8,192 |
音声/映像の仕様 |
プロンプトあたりの画像の最大数 3,600 動画の長さの上限 1 時間 音声の最大長 約 9.5 時間 |
[**] | レート制限
|
の機能 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象 関数呼び出し サポート対象 コードの実行 サポート対象 |
バージョン |
|
最終更新日 | 2024 年 9 月 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B は、低インテリジェンス タスク向けに設計された小型モデルです。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-flash-8b |
: サポートされているデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 1,048,576 出力トークンの上限 8,192 |
音声/映像の仕様 |
プロンプトあたりの画像の最大数 3,600 動画の長さの上限 1 時間 音声の最大長 約 9.5 時間 |
[**] | レート制限
|
の機能 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象 関数呼び出し サポート対象 コードの実行 サポート対象 |
バージョン |
|
最終更新日 | 2024 年 10 月 |
Gemini 1.5 Pro
Gemini 1.5 Pro は、幅広い推論タスクに最適化された中規模のマルチモーダル モデルです。1.5 Pro では、2 時間の動画、19 時間の音声、60,000 行のコードを含むコードベース、2,000 ページのテキストなど、大量のデータを一度に処理できます。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-pro |
: サポートされているデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 2,097,152 出力トークンの上限 8,192 |
音声/映像の仕様 |
プロンプトあたりの画像の最大数 7,200 動画の長さの上限 2 時間 音声の最大長 約 19 時間 |
[**] | レート制限
|
の機能 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象外 関数呼び出し サポート対象 コードの実行 サポート対象 |
バージョン |
|
最終更新日 | 2024 年 9 月 |
Gemini 1.0 Pro(非推奨)
Gemini 1.0 Pro は、マルチターン テキストとコードチャット、コード生成などのタスクを処理する NLP モデルです。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.0-pro |
: サポートされているデータ型 |
入力 テキスト 出力 テキスト |
[**] | レート制限
|
の機能 |
システム指示 サポート対象外 JSON モード サポート対象外 JSON スキーマ サポート対象外 調整可能な安全設定 サポート対象 キャッシュ保存 サポート対象外 チューニング サポート対象 関数呼び出し サポート対象 関数呼び出しの構成 サポート対象外 コードの実行 サポート対象外 |
バージョン |
|
最終更新日 | 2024 年 2 月 |
テキスト エンベディングとエンベディング
テキスト エンベディング
テキスト エンベディングは、文字列の関連性を測定するために使用され、多くの AI アプリケーションで広く使用されています。
text-embedding-004
は、標準の MTEB エンベディング ベンチマークで、同等のディメンションを持つ既存のモデルよりも優れた検索パフォーマンスを達成し、優れたパフォーマンスを発揮します。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード |
Gemini API
|
: サポートされているデータ型 |
入力 テキスト 出力 テキスト エンベディング |
[*] | トークンの上限
入力トークンの上限 2,048 出力ディメンションのサイズ 768 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
された調整可能な安全性設定 | サポート対象外 |
最終更新日 | 2024 年 4 月 |
埋め込み
エンベディング モデルを使用して、入力テキストのテキスト エンベディングを生成できます。
エンベディング モデルは、最大 2,048 トークンのテキストに対して 768 次元のエンベディングを作成するように最適化されています。
エンベディング モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード |
models/embedding-001
|
: サポートされているデータ型 |
入力 テキスト 出力 テキスト エンベディング |
[*] | トークンの上限
入力トークンの上限 2,048 出力ディメンションのサイズ 768 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
された調整可能な安全性設定 | サポート対象外 |
最終更新日 | 2023 年 12 月 |
AQA
AQA モデルを使用すると、ドキュメント、コーパス、または一連のパラグラフに対して属性付き質問応答(AQA)関連のタスクを実行できます。AQA モデルは、指定されたソースに基づく質問に対する回答と、回答可能な確率の推定値を返します。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/aqa |
: サポートされているデータ型 |
入力 テキスト 出力 テキスト |
サポートされている言語 | 英語 |
[*] | トークンの上限
入力トークンの上限 7,168 出力トークンの上限 1,024 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
された調整可能な安全性設定 | サポート対象 |
最終更新日 | 2023 年 12 月 |
これらのモデルのバリエーションの機能については、例をご覧ください。
[*] Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 ワード(英語)です。
[**] RPM: 1 分あたりのリクエスト数
TPM: 1 分あたりのトークン数
RPD: 1 日あたりのリクエスト数
TPD: 1 日あたりのトークン数
容量の制限により、指定された最大レートの上限は保証されません。
モデル バージョン名のパターン
Gemini モデルは、プレビュー版または安定版のいずれかを使用できます。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。
最新: 指定された生成とバリエーションのモデルの最先端バージョンを参照します。基盤となるモデルは定期的に更新され、プレビュー バージョンである場合があります。このエイリアスは、探索的テストアプリとプロトタイプでのみ使用してください。
最新バージョンを指定するには、
<model>-<generation>-<variation>-latest
というパターンを使用します。例:gemini-1.0-pro-latest
最新の安定版: 指定されたモデルの生成とバリエーション用にリリースされた最新の安定版を参照します。
最新の安定版を指定するには、
<model>-<generation>-<variation>
というパターンを使用します。例:gemini-1.0-pro
安定版: 特定の安定版モデルを指します。安定モデルは変更されません。ほとんどの本番環境アプリでは、特定の安定したモデルを使用する必要があります。
安定版を指定するには、
<model>-<generation>-<variation>-<version>
の形式を使用します。例:gemini-1.0-pro-001
試験運用版: 利用規約で定義されているように、プレビュー版で利用可能な試験運用版モデルを指します。つまり、本番環境での使用は想定されていません。試験運用版モデルは、フィードバックの収集、最新アップデートをデベロッパーに迅速に提供すること、Google のイノベーションのペースを強調することを目的としています。試験運用版のリリースから得られた知見は、モデルをより広範にリリースする方法に反映されます。試験運用版モデルは、事前の通知なく別のモデルと置き換えられる可能性があります。試験運用版モデルは、将来的に安定版モデルになるとは限りません。
試験運用版を指定するには、
<model>-<generation>-<variation>-<version>
というパターンを使用します。例:gemini-1.5-pro-exp-0827
対応言語
Gemini モデルは、次の言語で動作するようにトレーニングされています。
- アラビア語(
ar
) - ベンガル語(
bn
) - ブルガリア語(
bg
) - 中国語(簡体および繁体)(
zh
) - クロアチア語(
hr
) - チェコ語(
cs
) - デンマーク語(
da
) - オランダ語(
nl
) - 英語(
en
) - エストニア語(
et
) - フィンランド語(
fi
) - フランス語(
fr
) - ドイツ語(
de
) - ギリシャ語(
el
) - ヘブライ語(
iw
) - ヒンディー語(
hi
) - ハンガリー語(
hu
) - インドネシア語(
id
) - イタリア語(
it
) - 日本語(
ja
) - 韓国語(
ko
) - ラトビア語(
lv
) - リトアニア語(
lt
) - ノルウェー語(
no
) - ポーランド語(
pl
) - ポルトガル語(
pt
) - ルーマニア語(
ro
) - ロシア語(
ru
) - セルビア語(
sr
) - スロバキア語(
sk
) - スロベニア語(
sl
) - スペイン語(
es
) - スワヒリ語(
sw
) - スウェーデン語(
sv
) - タイ語(
th
) - トルコ語(
tr
) - ウクライナ語(
uk
) - ベトナム語(
vi
)