DataGemma

DataGemma est un outil de recherche qui permet aux utilisateurs de poser des questions en langage clair et de recevoir à partir de données statistiques accessibles au public dépôt Data Commons. L'outil utilise des versions spécialement conçues de Gemma, l'API Gemini avec Gemini 1.5 Pro et un ensemble de bibliothèques spécialement conçu pour fonctionner avec Data Commons.

Cet outil de recherche fournit deux techniques distinctes pour répondre aux questions basées sur les données Données statistiques courantes:

  • Génération entre la récupération (RIG) : cette approche utilise une variante de Gemma 2 qui est réglé pour reconnaître quand il doit remplacer un nombre généré par des informations plus précises auprès de Data Commons. Pour en savoir plus, consultez le notebook Colab et les modèles sur Kaggle ou Hugging Face.
  • Génération augmentée par récupération (RAG) : cette approche utilise une variante de Gemma 2 qui récupère des informations pertinentes à partir de Data Commons, puis utilise ces informations pour créer une requête étendue pour le modèle Gemini 1.5 Pro. Pour en savoir plus, consultez les Colab ordinateur ultraportable et des modèles sur Kaggle ou Visage câlin.

Pour d'autres recherches et détails techniques sur DataGemma, consultez le Article technique sur DataGemma.

  • Appliquez l'intelligence artificielle (IA) générative à un vaste dépôt de données statistiques publiques pour explorer et découvrir de nouveaux insights.
  • Étudier les moyens d'orienter les résultats des modèles d'IA générative à l'aide de techniques de récupération augmentée et entrelacée de données

En savoir plus

Affichez plus de code, des blocs-notes, des informations et des discussions sur le modèle RIG DataGemma sur Kaggle.
Essayez DataGemma avec la technique d'intercalation de récupération pour répondre à des questions.
Essayez DataGemma à l'aide de la technique de récupération augmentée pour répondre à des questions.