DataGemma

O DataGemma é uma ferramenta de pesquisa que permite aos usuários fazer perguntas em linguagem simples e receber respostas com base em dados estatísticos disponíveis publicamente no Data Commons. A ferramenta usa versões especialmente criadas do Gemma, a API Gemini com o Gemini 1.5 Pro e um conjunto de bibliotecas especificamente projetados para funcionar com o Data Commons.

Esta ferramenta de pesquisa fornece duas técnicas separadas para responder perguntas com base em Dados Dados estatísticos comuns:

  • Geração intercalada de recuperação (RIG, na sigla em inglês): essa abordagem usa uma variante da Gemma 2, que é ajustado para reconhecer quando precisa substituir um número gerado por informações mais precisas do Data Commons. Para mais detalhes, consulte o Colab notebook e modelos em Kaggle ou Hugging Face:
  • Geração Aumentada de Recuperação (RAG, na sigla em inglês): essa abordagem usa uma variante do Gemma. 2 que recupera informações relevantes do Data Commons e, em seguida, usa essas informações para criar um comando estendido no modelo Gemini 1.5 Pro. Para mais detalhes, consulte a O Colab notebook e modelos em Kaggle ou Hugging Face:

Para mais pesquisas e detalhes técnicos sobre o DataGemma, consulte a Artigo técnico do DataGemma.

  • Aplique a inteligência artificial (IA) generativa a um vasto repositório de dados estatísticos públicos para explorar e descobrir novos insights.
  • Investigue maneiras de orientar a saída do modelo de IA generativa com técnicas aumentadas de recuperação e intercaladas por dados.

Saiba mais

Veja mais códigos, notebooks, informações e discussões sobre o modelo RIG do DataGemma no Kaggle.
Teste o DataGemma usando a técnica de recuperação intercalada para responder a perguntas.
Teste o DataGemma usando a técnica aumentada de recuperação para responder a perguntas.