RecurrentGemma

RecurrentGemma は、Griffin に基づくオープンモデルです。これは、ゲート付き線形回帰とローカル スライディング ウィンドウ アテンションを組み合わせるハイブリッド モデルです。

Gemma と同様に、RecurrentGemma は質問応答、要約、推論など、さまざまなテキスト生成タスクに適しています。ただし、RecurrentGemma 独自のアーキテクチャには、次の利点もあります。

  • メモリ要件が低ければ、単一の GPU や CPU など、メモリが限られているデバイスでより長いサンプルを生成できます。
  • RecurrentGemma は大幅に大きいバッチサイズで推論を実行できます。つまり、特に長いシーケンスを生成する場合に、1 秒あたりかなり多くのトークンを生成できます。
  • RecurrentGemma は Gemma と同等のパフォーマンスを実現しながら、必要なメモリを減らし、推論を高速化します。

その他のリソース

RecurrentGemma のモデルカードには、モデルに関する詳細情報、実装情報、評価情報、モデルの使用状況と制限事項などが含まれています。
Kaggle で RecurrentGemma に関する他のコード、Colab ノートブック、情報、ディスカッションをご覧ください。
GitHub で JAX と PyTorch のサンプル Colab ノートブックを実行します。