EmbeddingGemma モデルの概要

EmbeddingGemma は、Gemma 3 に基づく 3 億 800 万のパラメータを持つ多言語テキスト エンベディング モデルです。スマートフォン、ノートパソコン、タブレットなどの日常的なデバイス向けに最適化されています。このモデルは、情報検索、セマンティック類似性検索、分類、クラスタリングなどのダウンストリーム タスクで使用するテキストの数値表現を生成します。

EmbeddingGemma には次の主な特徴があります。

  • 多言語サポート: 100 以上の言語でトレーニングされた幅広い言語データ理解。
  • 柔軟な出力ディメンション: Matryoshka Representation Learning(MRL)を使用して、速度とストレージのトレードオフのために出力ディメンションを 768 から 128 までカスタマイズします。
  • 2K トークン コンテキスト: ハードウェア上でテキストデータやドキュメントを直接処理するための実質的な入力コンテキスト。
  • ストレージ効率が高い: 量子化により 200 MB 未満の RAM で実行
  • 低レイテンシ: EdgeTPU で 22 ミリ秒未満の生成エンベディングにより、高速でスムーズなアプリケーションを実現します。
  • オフラインで安全: ドキュメントのエンベディングをハードウェア上で直接生成します。インターネット接続なしで動作し、機密データを安全に保ちます。

Hugging Face で入手 Kaggle で入手 Vertex でアクセス

他の Gemma モデルと同様に、EmbeddingGemma にはオープン ウェイトが用意されており、責任ある商用利用向けにライセンスが付与されています。これにより、独自のプロジェクトやアプリケーションでファインチューニングしてデプロイできます。

EmbeddingGemma を試す EmbeddingGemma をファインチューニングする