DataGemma

DataGemma to narzędzie, które pozwala zadawać pytania prostym językiem i otrzymywać na podstawie publicznie dostępnych danych statystycznych repozytorium Data Commons. Narzędzie wykorzystuje specjalne wersje Gemma, Gemini API z Gemini 1.5 Pro oraz zestawem bibliotek stworzonych z myślą o współpracy z Data Commons.

To narzędzie do badań zawiera 2 oddzielne metody udzielania odpowiedzi na pytania na podstawie danych statystycznych z Data Commons:

  • Retrieval-Interleaved Generation (RIG) – w tym podejściu wykorzystuje wariant Gemma 2, która jest dostrojona tak, aby rozpoznaje, kiedy musi zastąpić wygenerowany numer przez dokładniejsze informacje ze strony Data Commons. Więcej informacji znajdziesz w sekcji Colab notatnik i modele włączone Kaggle lub Hugging Face
  • Generowanie rozszerzone przez wyszukiwanie w zapisanych informacjach (RAG) – to podejście wykorzystuje wariant modelu Gemma 2, który pobiera odpowiednie informacje z Data Commons, a następnie używa ich do tworzenia rozszerzonego promptu dla modelu Gemini 1.5 Pro. Więcej informacji: Colab notatnik i modele włączone Kaggle lub Hugging Face

Więcej badań i szczegółów technicznych na temat DataGemma znajdziesz w Dokumentacja techniczna DataGemma.

  • Stosowanie generatywnej sztucznej inteligencji (AI) do ogromnego repozytorium publicznych danych statystycznych, aby odkrywać i odkrywać nowe informacje.
  • Zbadaj, jak kierować danymi wyjściowymi modelu generatywnej AI przy użyciu technik z rozszerzaniem pobierania i przeplataniem danych.

Więcej informacji

Wyświetl więcej kodu, notatniki, informacje i dyskusje na temat modelu RIG DataGemma w Kaggle.
Wypróbuj DataGemma, aby uzyskać odpowiedzi na pytania, korzystając z metody z przeplotem pobierania danych.
Wypróbuj DataGemma, aby odpowiadać na pytania, korzystając z metody skanowania rozszerzonego.