RecurrentGemma | Google AI for Developers

前往 Gemma Cookbook 存放區取得產生與調整範例！瞭解詳情

本頁面由 Cloud Translation API 翻譯而成。

RecurrentGemma

RecurrentGemma 指的是根據 Griffin 是一種混合型模型架構混合了封閉式線性週期和局部滑動視窗注意力。

和 Gemma 一樣，RecurrentGemma 尤其適合用於像是回答問題、摘要等。不過，RecurrentGemma 的獨特架構提供下列額外優點：

降低記憶體用量

記憶體需求較低，在記憶體有限的裝置 (例如單一 GPU 或 CPU) 上產生較長的樣本。
處理量較高

RecurrentGemma 能以極高的批量執行推論，因此每秒可產生更多符記，尤其是產生長序列時。
高效能

RecurrentGemma 與 Gemma 的效能相輔相成，不但需要較少記憶體，還能加快推論速度。

其他資源

查看模型資訊卡

RecurrentGemma 的模型資訊卡內含模型、實作資訊、評估資訊、模型用法和限制等詳細資訊。

前往 Kaggle 查看

在 Kaggle 上查看更多與 RecurrentGemma 相關的程式碼、Colab 筆記本、資訊和討論。

在 GitHub 上執行

在 GitHub 上執行 JAX 和 PyTorch 適用的範例 Colab 筆記本。

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2024-08-05 (世界標準時間)。