Gemini

モデル バリエーション

Gemini API は特定の用途に合わせて最適化されたさまざまなモデルを提供 対応できます利用可能な Gemini のバリアントの概要は次のとおりです。

モデル バリアント 入力 出力 最適な用途
Gemini 1.5 Pro
gemini-1.5-pro
音声、画像、動画、テキスト テキスト コード生成やテキスト生成などの複雑な推論タスク テキスト編集、問題解決、データの抽出と生成
Gemini 1.5 Flash
gemini-1.5-flash
音声、画像、動画、テキスト テキスト さまざまなタスクで高速かつ汎用性の高いパフォーマンスを実現
Gemini 1.0 Pro
gemini-1.0-pro
テキスト テキスト 自然言語タスク、マルチターン テキストとコードチャット、コード 世代
(非推奨)Gemini 1.0 Pro Vision
gemini-pro-vision
画像、動画、テキスト テキスト 画像の生成など、視覚関連のタスク 画像内のオブジェクトを識別したり
テキスト エンベディング
text-embedding-004
テキスト テキスト エンベディング テキスト文字列の関連性の測定
AQA
aqa
テキスト テキスト 質問に対してソースに基づいた回答を提供する

次の表に、Gemini モデルの属性を示します。 すべてのモデル バリアントに共通:

属性 説明
トレーニング データ Gemini のナレッジ カットオフ日は 2023 年 11 月です。 それ以降のイベントについての知識は限られます。
サポートされている言語 利用可能な言語を見る
構成可能なモデル パラメータ
  • Top-P
  • トップ K
  • 温度
  • 停車シーケンス
  • 最大出力長
  • レスポンス候補の数

詳細については、モデル パラメータ セクション 生成モデルのガイドをご覧ください。

Gemini 1.5 Flash

Gemini 1.5 Flash は、さまざまなシステムにまたがるスケーリングに対応する、高速で多用途のマルチモーダル モデルです。 多岐にわたります。

AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash
サポートされているデータ型

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声と映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の最大長

1 時間

音声の最大長

約 9.5 時間

レート制限[**] <ph type="x-smartling-placeholder">
</ph> 無料: <ph type="x-smartling-placeholder">
    </ph>
  • 15 rpm
  • 100 万 TPM
  • 1,500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 1,000 rpm
  • 200 万 TPM
能力

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象外

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

関数呼び出しの構成

サポート対象

コードの実行

サポート対象

最新の更新 2024 年 5 月

Gemini 1.5 Pro

Gemini 1.5 Pro は中規模マルチモーダル モデルであり、 推論タスクを実行できます。1.5 Pro では大量のデータを処理可能 2 時間の動画、19 時間の音声、コードベースの 60,000 行のコード、または 2,000 ページのテキスト。

AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-pro
サポートされているデータ型

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

2,097,152

出力トークンの上限

8,192

音声と映像の仕様

プロンプトあたりの画像の最大数

7,200

動画の最大長

2 時間

音声の最大長

約 19 時間

レート制限[**] <ph type="x-smartling-placeholder">
</ph> 無料: <ph type="x-smartling-placeholder">
    </ph>
  • 2 rpm
  • 32,000 TPM
  • 50 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 rpm
  • 200 万 TPM
  • 10,000 RPD
能力

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

関数呼び出しの構成

サポート対象

コードの実行

サポート対象

最新の更新 2024 年 5 月

Gemini 1.0 Pro

Gemini 1.0 Pro は、マルチターン テキストなどのタスクを処理する NLP モデルで、 コードチャット、コード生成です

AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.0-pro
サポートされているデータ型

入力

テキスト

出力

テキスト

レート制限[**] <ph type="x-smartling-placeholder">
</ph> 無料: <ph type="x-smartling-placeholder">
    </ph>
  • 15 rpm
  • 32,000 TPM
  • 1,500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 rpm
  • 120,000 TPM
  • 30,000 RPD
能力

システム指示

サポート対象外

JSON モード

サポート対象外

JSON スキーマ

サポート対象外

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象外

チューニング

サポート対象

関数呼び出し

サポート対象

関数呼び出しの構成

サポート対象外

コードの実行

サポート対象外

最新の更新 2024 年 2 月
<ph type="x-smartling-placeholder">

(非推奨)Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision はパフォーマンスが最適化されたマルチモーダル モデル ビジュアル関連のタスクを実行できますたとえば、1.0 Pro Vision は 画像の説明の生成、画像内のオブジェクトの特定、 画像に含まれる場所や物体に関する情報などが含まれます。

モデルの詳細

プロパティ 説明
モデルコード models/gemini-pro-vision
サポートされているデータ型

入力

画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

12,288

出力トークンの上限

4,096

音声と映像の仕様

動画の最大長

2 分

レート制限[**] 1 分あたり 60 回のリクエスト
能力

システム指示

サポート対象外

JSON モード

サポート対象外

JSON スキーマ

サポート対象外

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象外

チューニング

サポート対象外

関数呼び出し

サポート対象

関数呼び出しの構成

サポート対象外

コードの実行

サポート対象外

最新の更新 2023 年 12 月

テキストの埋め込みと埋め込み

テキスト エンベディング

テキスト エンベディング モデルを使用して、テキスト エンベディングの テキスト エンベディング、 表示されます。テキスト エンベディング モデルについて詳しくは、以下をご覧ください。 Vertex AI の生成 AI のドキュメント 詳しく学びます。

テキスト エンベディング モデルは 768 時間でエンベディングを作成するために最適化されている 最大 2,048 個のトークンのテキストのディメンション。テキスト エンベディングには弾力性があり、 エンベディング サイズを 768 未満にすることをおすすめします。弾力性のあるエンベディングを使用すると、 出力次元が小さくなり、コンピューティングとストレージの費用が削減される可能性がある パフォーマンスがわずかに低下します

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

サポートされているデータ型

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンション サイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
調整可能な安全設定 サポート対象外
最新の更新 2024 年 4 月

埋め込み

<ph type="x-smartling-placeholder">

エンべディング モデルを使用すると、 テキスト エンベディング、 表示されます。

エンベディング モデルは 768 次元のエンベディングを作成するために最適化されている 最大 2,048 トークンのテキストの場合。

エンベディング モデルの詳細
プロパティ 説明
モデルコード models/embedding-001
サポートされているデータ型

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンション サイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
調整可能な安全設定 サポート対象外
最新の更新 2023 年 12 月

AQA

AQA モデルを使用すると、 アトリビューションのある質問応答 (AQA)関連のタスクを、ドキュメント、コーパス、または一連の文に対して適用できます。AQA モデルは、提供されたソースに基づいて質問に対する回答を返します。 回答可能な確率を推定します

モデルの詳細

プロパティ 説明
モデルコード models/aqa
サポートされているデータ型

入力

テキスト

出力

テキスト

対応言語 英語
トークンの上限[*]

入力トークンの上限

7,168

出力トークンの上限

1,024

レート制限[**] 1 分あたり 1,500 件のリクエスト
調整可能な安全設定 サポート対象
最新の更新 2023 年 12 月

これらのモデルの機能については、をご覧ください。 あります。

[*] 1 トークンは Gemini モデルで約 4 文字に相当します。100 トークン 約 60 ~ 80 語です。

[**] RPM: 1 分あたりのリクエスト数
TPM: 1 分あたりのトークン数
RPD: 1 日あたりのリクエスト数
TPD: 1 日あたりのトークン数

容量制限により、指定された最大レート制限は 保証されています。

モデル バージョン名のパターン

Gemini モデルには、プレビュー版または安定版があります。対象: 次のモデル名形式のいずれかを使用して、使用するモデルを バージョンを指定します。

  • 最新: 指定されたモデルの最先端のモデルを指します。 多岐にわたります。基盤となるモデルは定期的に更新されるため、 プレビュー版として利用できます。探索的テストを行うアプリとプロトタイプでのみ、 このエイリアスを使用します

    最新バージョンを指定するには、次のパターンを使用します。 <model>-<generation>-<variation>-latest。例: gemini-1.0-pro-latest

  • 最新の安定版: 用にリリースされた最新の安定版を指します。 モデルの生成とバリエーションを追跡できます。

    最新の安定版を指定するには、次のパターンを使用します。 <model>-<generation>-<variation>。例: gemini-1.0-pro

  • Stable: 特定の安定版モデルを指します。安定したモデルは変更されません。 ほとんどの本番環境アプリでは、特定の安定版モデルを使用する必要があります。

    安定版を指定するには、次のパターンを使用します。 <model>-<generation>-<variation>-<version>。例: gemini-1.0-pro-001

対応言語

Gemini モデルは、次の言語で動作するようにトレーニングされています。

  • アラビア語(ar
  • ベンガル語(bn
  • ブルガリア語(bg
  • 中国語(簡体および繁体)(zh
  • クロアチア語(hr
  • チェコ語(cs
  • デンマーク語(da
  • オランダ語(nl
  • 英語(en
  • エストニア語(et
  • フィンランド語(fi
  • フランス語(fr
  • ドイツ語(de
  • ギリシャ語(el
  • ヘブライ語(iw
  • ヒンディー語(hi
  • ハンガリー語(hu
  • インドネシア語(id
  • イタリア語(it
  • 日本語(ja
  • 韓国語(ko
  • ラトビア語(lv
  • リトアニア語(lt
  • ノルウェー語(no
  • ポーランド語(pl
  • ポルトガル語(pt
  • ルーマニア語(ro
  • ロシア語(ru
  • セルビア語(sr
  • スロバキア語(sk
  • スロベニア語(sl
  • スペイン語(es
  • スワヒリ語(sw
  • スウェーデン語(sv
  • タイ語(th
  • トルコ語(tr
  • ウクライナ語(uk
  • ベトナム語(vi