RecurrentGemma
RecurrentGemma は、ゲート付き線形の繰り返しとローカル スライディング ウィンドウ アテンションを組み合わせたハイブリッド モデル アーキテクチャである Griffin に基づくオープンモデルです。
Gemma と同様に、RecurrentGemma は質問応答、要約、推論などのさまざまなテキスト生成タスクに適しています。ただし、RecurrentGemma 独自のアーキテクチャには、さらに次のような利点があります。
-
メモリ使用量の削減
メモリ要件が低ければ、単一の GPU や CPU など、メモリが限られているデバイスでより長いサンプルを生成できます。 -
スループットの向上
RecurrentGemma は大幅に大きいバッチサイズで推論を実行できます。つまり、特に長いシーケンスを生成する場合に、1 秒あたりかなり多くのトークンを生成できます。 -
高パフォーマンス
RecurrentGemma は Gemma と同等のパフォーマンスを実現しながら、必要なメモリを減らし、推論を高速化します。
その他のリソース
モデルカードを表示する
RecurrentGemma のモデルカードには、モデルに関する詳細情報、実装情報、評価情報、モデルの使用状況と制限事項などが含まれています。
Kaggle で表示
Kaggle で RecurrentGemma に関する他のコード、Colab ノートブック、情報、ディスカッションをご覧ください。
GitHub で実行
GitHub で JAX と PyTorch のサンプル Colab ノートブックを実行します。