Gemini は、デベロッパーがコンテンツを生成して問題を解決できる生成 AI モデルのファミリーです。これらのモデルは、テキストと画像の両方を入力として処理するように設計、トレーニングされています。このガイドでは、各モデル バリアントに関する情報を提供し、どちらがユースケースに最も適しているかを判断するのに役立ちます。
利用可能なモデルとその機能の概要は次のとおりです。
モデル | 入力 | 出力 |
---|---|---|
Gemini | ||
|
テキストと画像 | テキスト |
|
テキスト | テキスト |
|
テキストと画像 | テキスト |
エンベディング | ||
|
テキスト | テキスト エンベディング |
取得 | ||
|
テキスト | テキスト |
安全性と使用目的
生成 AI モデルは強力なツールですが、制限が存在します。その汎用性と適用性により、不正確、バイアス、不適切な出力など、予期しない出力が発生する可能性があります。このような出力による被害のリスクを抑えるには、後処理と厳格な手動評価が不可欠です。安全な使用に関するその他の推奨事項については、安全に関するガイダンスをご覧ください。
Gemini API が提供するモデルは、さまざまな生成 AI や自然言語処理(NLP)アプリケーションに使用できます。これらの機能は、Gemini API または Google AI Studio ウェブアプリでのみ使用できます。Gemini API の使用には、生成 AI の使用禁止に関するポリシーと Gemini API の利用規約も適用されます。
モデルサイズ
次の表に、利用可能なサイズとそれぞれの意味を示します。
モデルサイズ | 説明 | サービス |
---|---|---|
Gemini 1.0 Pro | 機能と効率のバランスが取れたモデルサイズ。 |
|
モデル バージョン
Gemini モデルには、プレビュー バージョンと安定版があります。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。
最新: 指定した世代とバリエーションのモデルの最新バージョンを指します。基盤となるモデルは定期的に更新され、場合によってはプレビュー版になります。このエイリアスは、探索的テストのアプリとプロトタイプでのみ使用できます。
最新バージョンを指定するには、
<model>-<generation>-<variation>-latest
のパターンを使用します。例:gemini-1.0-pro-latest
。最新の安定版: 指定したモデル世代とバリエーション向けにリリースされた最新の安定版を指します。
最新の安定版を指定するには、
<model>-<generation>-<variation>
のパターンを使用します。例:gemini-1.0-pro
安定版: 特定の安定版モデルを指します。安定版のモデルは変わりません。ほとんどの本番環境アプリは、特定の安定版モデルを使用する必要があります。
安定版を指定するには、
<model>-<generation>-<variation>-<version>
のパターンを使用します。例:gemini-1.0-pro-001
。
安定版のモデルについては、モデル バリエーションのモデルの「モデル名」行をご覧ください。
モデル バリエーション
Gemini API には、特定のユースケースに合わせて最適化されたさまざまなモデルが用意されています。次の表に、それぞれの属性を示します。
バリエーション | 属性 | 説明 |
---|---|---|
Gemini 1.5 Pro(プレビューのみ) | モデルの最終更新 | 2024 年 4 月 |
モデルコード | models/gemini-1.5-pro-latest |
|
モデルの機能 |
|
|
サポートされている生成方法 | generateContent |
|
入力トークンの上限 | 1048576 | |
出力トークンの上限 | 8,192 | |
モデルの安全性 | 自動的に適用される安全性設定(デベロッパーが調整可能)。 詳細については、安全性設定のトピックをご覧ください。 | |
レート上限 | 1 分あたり 2 クエリ、1 日あたり 1, 000 クエリ[1] | |
Gemini Pro | モデルの最終更新日 | 2024 年 2 月 |
モデルコード | models/gemini-pro |
|
モデルの機能 |
|
|
サポートされている生成方法 | generateContent |
|
入力トークンの上限 | 30720 | |
出力トークンの上限 | 2048 | |
モデルの安全性 | 自動的に適用される安全性設定(デベロッパーが調整可能)。 詳細については、安全性設定のトピックをご覧ください。 | |
レート上限 | 1 分あたり 60 回のリクエスト[1] | |
モデル名 |
|
|
Gemini 1.0 Pro Vision | モデルの最終更新日 | 2023 年 12 月 |
モデルコード | models/gemini-pro-vision |
|
モデルの機能 |
|
|
サポートされている生成方法 | generateContent |
|
入力トークンの上限 | 12,288 | |
出力トークンの上限 | 4,096 | |
モデルの安全性 | 自動的に適用される安全性設定(デベロッパーが調整可能)。 詳細については、安全性設定のトピックをご覧ください。 | |
レート上限 | 1 分あたり 60 回のリクエスト[1] | |
エンべディング | モデルの最終更新 | 2023 年 12 月 |
モデルコード | models/embedding-001 |
|
モデルの機能 |
|
|
サポートされている生成方法 | embedContent |
|
モデルの安全性 | 調整可能な安全設定はありません。 | |
レート上限 | 1 分あたり 1,500 回のリクエスト[1] | |
テキスト エンベディング | モデルの最終更新 | 2024 年 4 月 |
モデルコード | models/text-embedding-004 (Vertex AI では text-embedding-preview-0409 ) |
|
モデルの機能 |
|
|
サポートされている生成方法 | embedContent |
|
モデルの安全性 | 調整可能な安全設定はありません。 | |
レート上限 | 1 分あたり 1,500 回のリクエスト[1] | |
AQA | モデルの最終更新日 | 2023 年 12 月 |
モデルコード | models/aqa |
|
モデルの機能 |
|
|
サポートされている生成方法 | generateAnswer |
|
対応している言語 | 英語 | |
入力トークンの上限 | 7168 | |
出力トークンの上限 | 1024 | |
モデルの安全性 | 自動的に適用される安全性設定(デベロッパーが調整可能)。 詳細については、安全性設定のトピックをご覧ください。 | |
レート上限 | 1 分あたり 60 回のリクエスト[1] |
これらのモデル バリエーションの機能については、例をご覧ください。
モデル メタデータ
ModelService
API を使用して、入力トークンや出力トークンの上限など、最新モデルに関する追加のメタデータを取得します。次の表に、Gemini Pro モデル バリアントのメタデータを示します。
属性 | 値 |
---|---|
表示名 | Gemini 1.0 Pro |
モデルコード | models/gemini-1.0-pro |
説明 | テキスト生成の対象モデル |
サポートされている生成方法 | generateContent |
Temperature | 0.9 |
top_p | 1 |
top_k | 1 |
モデル属性
次の表に、すべてのモデル バリエーションに共通する Gemini モデルの属性を示します。
属性 | 説明 |
---|---|
トレーニング データ | Gemini のナレッジのカットオフは 2023 年初頭です。それ以降に発生したイベントに関する情報は制限されます。 |
対応している言語 | 対応言語を見る |
構成可能なモデル パラメータ |
|
[1] 容量制限により、指定された最大レート制限が保証されるわけではありません。
これらの各パラメータの詳細については、LLM の概要ガイドのモデル パラメータ セクションをご覧ください。
次のステップ
- コードで開始する方法については、Google AI Studio のクイックスタートをご覧ください。
- API の使用を開始するには、Python クイックスタートをご覧ください。