モデル バリエーション
Gemini API は特定の用途に合わせて最適化されたさまざまなモデルを提供 対応できます利用可能な Gemini のバリアントの概要は次のとおりです。
モデル バリアント | 入力 | 出力 | 最適な用途 |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
音声、画像、動画、テキスト | テキスト | コード生成やテキスト生成などの複雑な推論タスク テキスト編集、問題解決、データの抽出と生成 |
Gemini 1.5 Flash
gemini-1.5-flash |
音声、画像、動画、テキスト | テキスト | さまざまなタスクで高速かつ汎用性の高いパフォーマンスを実現 |
Gemini 1.0 Pro
gemini-1.0-pro |
テキスト | テキスト | 自然言語タスク、マルチターン テキストとコードチャット、コード 世代 |
(非推奨)Gemini 1.0 Pro Vision
gemini-pro-vision
|
画像、動画、テキスト | テキスト | 画像の生成など、視覚関連のタスク 画像内のオブジェクトを識別したり |
テキスト エンベディング
text-embedding-004 |
テキスト | テキスト エンベディング | テキスト文字列の関連性の測定 |
AQA
aqa |
テキスト | テキスト | 質問に対してソースに基づいた回答を提供する |
次の表に、Gemini モデルの属性を示します。 すべてのモデル バリアントに共通:
属性 | 説明 |
---|---|
トレーニング データ | Gemini のナレッジ カットオフ日は 2023 年 11 月です。 それ以降のイベントについての知識は限られます。 |
サポートされている言語 | 利用可能な言語を見る |
構成可能なモデル パラメータ |
|
詳細については、モデル パラメータ セクション 生成モデルのガイドをご覧ください。
Gemini 1.5 Flash
Gemini 1.5 Flash は、さまざまなシステムにまたがるスケーリングに対応する、高速で多用途のマルチモーダル モデルです。 多岐にわたります。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-flash |
サポートされているデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 1,048,576 出力トークンの上限 8,192 |
音声と映像の仕様 |
プロンプトあたりの画像の最大数 3,600 動画の最大長 1 時間 音声の最大長 約 9.5 時間 |
[**] | レート制限
<ph type="x-smartling-placeholder">
|
能力 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象外 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象外 関数呼び出し サポート対象 関数呼び出しの構成 サポート対象 コードの実行 サポート対象 |
最新の更新 | 2024 年 5 月 |
Gemini 1.5 Pro
Gemini 1.5 Pro は中規模マルチモーダル モデルであり、 推論タスクを実行できます。1.5 Pro では大量のデータを処理可能 2 時間の動画、19 時間の音声、コードベースの 60,000 行のコード、または 2,000 ページのテキスト。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.5-pro |
サポートされているデータ型 |
入力 音声、画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 2,097,152 出力トークンの上限 8,192 |
音声と映像の仕様 |
プロンプトあたりの画像の最大数 7,200 動画の最大長 2 時間 音声の最大長 約 19 時間 |
[**] | レート制限
<ph type="x-smartling-placeholder">
|
能力 |
システム指示 サポート対象 JSON モード サポート対象 JSON スキーマ サポート対象 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象 チューニング サポート対象外 関数呼び出し サポート対象 関数呼び出しの構成 サポート対象 コードの実行 サポート対象 |
最新の更新 | 2024 年 5 月 |
Gemini 1.0 Pro
Gemini 1.0 Pro は、マルチターン テキストなどのタスクを処理する NLP モデルで、 コードチャット、コード生成です
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-1.0-pro |
サポートされているデータ型 |
入力 テキスト 出力 テキスト |
[**] | レート制限
<ph type="x-smartling-placeholder">
|
能力 |
システム指示 サポート対象外 JSON モード サポート対象外 JSON スキーマ サポート対象外 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象外 チューニング サポート対象 関数呼び出し サポート対象 関数呼び出しの構成 サポート対象外 コードの実行 サポート対象外 |
最新の更新 | 2024 年 2 月 |
(非推奨)Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision はパフォーマンスが最適化されたマルチモーダル モデル ビジュアル関連のタスクを実行できますたとえば、1.0 Pro Vision は 画像の説明の生成、画像内のオブジェクトの特定、 画像に含まれる場所や物体に関する情報などが含まれます。
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/gemini-pro-vision |
サポートされているデータ型 |
入力 画像、動画、テキスト 出力 テキスト |
[*] | トークンの上限
入力トークンの上限 12,288 出力トークンの上限 4,096 |
音声と映像の仕様 |
動画の最大長 2 分 |
[**] | レート制限1 分あたり 60 回のリクエスト |
能力 |
システム指示 サポート対象外 JSON モード サポート対象外 JSON スキーマ サポート対象外 調整可能な安全性設定 サポート対象 キャッシュ保存 サポート対象外 チューニング サポート対象外 関数呼び出し サポート対象 関数呼び出しの構成 サポート対象外 コードの実行 サポート対象外 |
最新の更新 | 2023 年 12 月 |
テキストの埋め込みと埋め込み
テキスト エンベディング
テキスト エンベディング モデルを使用して、テキスト エンベディングの テキスト エンベディング、 表示されます。テキスト エンベディング モデルについて詳しくは、以下をご覧ください。 Vertex AI の生成 AI のドキュメント 詳しく学びます。
テキスト エンベディング モデルは 768 時間でエンベディングを作成するために最適化されている 最大 2,048 個のトークンのテキストのディメンション。テキスト エンベディングには弾力性があり、 エンベディング サイズを 768 未満にすることをおすすめします。弾力性のあるエンベディングを使用すると、 出力次元が小さくなり、コンピューティングとストレージの費用が削減される可能性がある パフォーマンスがわずかに低下します
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード |
Gemini API
|
サポートされているデータ型 |
入力 テキスト 出力 テキスト エンベディング |
[*] | トークンの上限
入力トークンの上限 2,048 出力ディメンション サイズ 768 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
調整可能な安全設定 | サポート対象外 |
最新の更新 | 2024 年 4 月 |
埋め込み
<ph type="x-smartling-placeholder">エンべディング モデルを使用すると、 テキスト エンベディング、 表示されます。
エンベディング モデルは 768 次元のエンベディングを作成するために最適化されている 最大 2,048 トークンのテキストの場合。
エンベディング モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード |
models/embedding-001
|
サポートされているデータ型 |
入力 テキスト 出力 テキスト エンベディング |
[*] | トークンの上限
入力トークンの上限 2,048 出力ディメンション サイズ 768 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
調整可能な安全設定 | サポート対象外 |
最新の更新 | 2023 年 12 月 |
AQA
AQA モデルを使用すると、 アトリビューションのある質問応答 (AQA)関連のタスクを、ドキュメント、コーパス、または一連の文に対して適用できます。AQA モデルは、提供されたソースに基づいて質問に対する回答を返します。 回答可能な確率を推定します
モデルの詳細
プロパティ | 説明 |
---|---|
モデルコード | models/aqa |
サポートされているデータ型 |
入力 テキスト 出力 テキスト |
対応言語 | 英語 |
[*] | トークンの上限
入力トークンの上限 7,168 出力トークンの上限 1,024 |
[**] | レート制限1 分あたり 1,500 件のリクエスト |
調整可能な安全設定 | サポート対象 |
最新の更新 | 2023 年 12 月 |
これらのモデルの機能については、例をご覧ください。 あります。
[*] 1 トークンは Gemini モデルで約 4 文字に相当します。100 トークン 約 60 ~ 80 語です。
[**] RPM: 1 分あたりのリクエスト数
TPM: 1 分あたりのトークン数
RPD: 1 日あたりのリクエスト数
TPD: 1 日あたりのトークン数
容量制限により、指定された最大レート制限は
保証されています。
モデル バージョン名のパターン
Gemini モデルには、プレビュー版または安定版があります。対象: 次のモデル名形式のいずれかを使用して、使用するモデルを バージョンを指定します。
最新: 指定されたモデルの最先端のモデルを指します。 多岐にわたります。基盤となるモデルは定期的に更新されるため、 プレビュー版として利用できます。探索的テストを行うアプリとプロトタイプでのみ、 このエイリアスを使用します
最新バージョンを指定するには、次のパターンを使用します。
<model>-<generation>-<variation>-latest
。例:gemini-1.0-pro-latest
。最新の安定版: 用にリリースされた最新の安定版を指します。 モデルの生成とバリエーションを追跡できます。
最新の安定版を指定するには、次のパターンを使用します。
<model>-<generation>-<variation>
。例:gemini-1.0-pro
Stable: 特定の安定版モデルを指します。安定したモデルは変更されません。 ほとんどの本番環境アプリでは、特定の安定版モデルを使用する必要があります。
安定版を指定するには、次のパターンを使用します。
<model>-<generation>-<variation>-<version>
。例:gemini-1.0-pro-001
。
対応言語
Gemini モデルは、次の言語で動作するようにトレーニングされています。
- アラビア語(
ar
) - ベンガル語(
bn
) - ブルガリア語(
bg
) - 中国語(簡体および繁体)(
zh
) - クロアチア語(
hr
) - チェコ語(
cs
) - デンマーク語(
da
) - オランダ語(
nl
) - 英語(
en
) - エストニア語(
et
) - フィンランド語(
fi
) - フランス語(
fr
) - ドイツ語(
de
) - ギリシャ語(
el
) - ヘブライ語(
iw
) - ヒンディー語(
hi
) - ハンガリー語(
hu
) - インドネシア語(
id
) - イタリア語(
it
) - 日本語(
ja
) - 韓国語(
ko
) - ラトビア語(
lv
) - リトアニア語(
lt
) - ノルウェー語(
no
) - ポーランド語(
pl
) - ポルトガル語(
pt
) - ルーマニア語(
ro
) - ロシア語(
ru
) - セルビア語(
sr
) - スロバキア語(
sk
) - スロベニア語(
sl
) - スペイン語(
es
) - スワヒリ語(
sw
) - スウェーデン語(
sv
) - タイ語(
th
) - トルコ語(
tr
) - ウクライナ語(
uk
) - ベトナム語(
vi
)