DataGemma

DataGemma es una herramienta de investigación que permite a los usuarios hacer preguntas respuestas basadas en datos estadísticos disponibles públicamente en la Data Commons. La herramienta utiliza versiones especiales de Gemma, la API de Gemini con Gemini 1.5 Pro y un conjunto de bibliotecas diseñados específicamente para trabajar con Data Commons.

Esta herramienta de investigación proporciona dos técnicas independientes para responder preguntas basadas en datos Datos estadísticos comunes:

  • Generación de intercalación de recuperación (RIG): este enfoque usa una variante de Gemma 2 que se ajustó para reconocer cuándo necesita reemplazar un número generado por información más precisa de Data Commons. Para obtener más información, consulta Colab bloc de notas y modelos en Kaggle o Cara de abrazo.
  • Generación aumentada de recuperación (RAG): Este enfoque usa una variante de Gemma 2 que recupera información relevante de Data Commons y, luego, utiliza esa información para crear una instrucción extendida para el modelo de Gemini 1.5 Pro. Para obtener más detalles, consulta la Colab bloc de notas y modelos en Kaggle o Cara de abrazo.

Para obtener más información de investigación y detalles técnicos sobre DataGemma, consulta el documento técnico de DataGemma.

  • Aplica la Inteligencia Artificial (IA) generativa a un amplio repositorio de datos estadísticos públicos para explorar y descubrir nuevas estadísticas.
  • Investiga formas de guiar el resultado de los modelos de IA generativa con técnicas de recuperación aumentadas e intercaladas de datos.

Más información

Consulta más código, notebooks, información y debates sobre el modelo de RIG de DataGemma en Kaggle.
Prueba DataGemma con la técnica intercalada de recuperación para responder preguntas.
Prueba DataGemma con la técnica de recuperación aumentada para responder preguntas.