DataGemma

DataGemma は、ユーザーがわかりやすい言葉で質問して、 一般に入手可能な統計データに基づいて、 データコモンズ リポジトリ。このツールは、特別にビルドされたバージョンの Gemma、Gemini 1.5 Pro の Gemini API、Data Commons と連携するように特別に設計された一連のライブラリを使用します。

この調査ツールには、Data Commons の統計データに基づいて質問に回答するための 2 つの異なる手法が用意されています。

  • 検索インターリーブ生成(RIG) - このアプローチでは、 Gemma 2。生成された数値を次の値に置き換える必要があるタイミングを認識するようにファインチューニングされています。 データコモンズより正確な情報を提供します詳しくは Colab ノートブック モデルを運用化し、 Kaggle または Hugging Face
  • 検索拡張生成(RAG) - このアプローチでは、Gemma のバリアントを使用します。 2. 関連する情報をデータコモンズから取得し、その情報を使用する Gemini 1.5 Pro モデルの拡張プロンプトを作成します。詳しくは、 Colab ノートブック モデルを運用化し、 Kaggle または Hugging Face

DataGemma に関する調査と技術的な詳細については、 DataGemma テクニカル ペーパー

  • 公開されている統計データの膨大なリポジトリに生成 AI を適用し、新しい分析情報を探索、発見します。
  • 検索拡張技術とデータ インターリーブ技術を使用して、生成 AI モデルの出力を導く方法を検討する。

詳細

Kaggle の DataGemma RIG モデルに関するその他のコード、ノートブック、情報、ディスカッションをご覧ください。
検索インターリーブの手法を使用して質問に回答する DataGemma をお試しください。
検索拡張手法を使用して質問に答える DataGemma をお試しください。