DataGemma

DataGemma adalah alat riset yang memungkinkan pengguna mengajukan pertanyaan dalam bahasa sederhana dan menerima jawaban berdasarkan data statistik yang tersedia secara publik di repositori Data Commons. {i>Tool<i} ini menggunakan versi Gemma yang dibuat khusus, Gemini API dengan Gemini 1.5 Pro, dan serangkaian library dirancang khusus untuk bekerja dengan Data Commons.

Alat penelitian ini menyediakan dua teknik terpisah untuk menjawab pertanyaan berdasarkan Data Data statistik umum:

  • Retrieval-Interleaved Generation (RIG) - Pendekatan ini menggunakan varian Gemma 2 yang disesuaikan untuk mengenali kapan perlu mengganti nomor yang dihasilkan dengan informasi yang lebih akurat dari Data Commons. Untuk mengetahui detail selengkapnya, lihat Colab notebook dan model di Kaggle atau Wajah Memeluk.
  • Retrieval-Augmented Generation (RAG) - Pendekatan ini menggunakan varian Gemma 2 yang mengambil informasi yang relevan dari Data Commons, lalu menggunakan informasi tersebut untuk membuat prompt yang diperluas untuk model Gemini 1.5 Pro. Untuk mengetahui detail selengkapnya, lihat Colab notebook dan model di Kaggle atau Wajah Memeluk.

Untuk detail penelitian dan teknis selengkapnya tentang DataGemma, lihat Panduan teknis DataGemma.

  • Terapkan kecerdasan buatan (AI) generatif ke repositori luas data statistik publik untuk menjelajahi dan menemukan insight baru.
  • Menyelidiki cara untuk memandu output model AI generatif dengan teknik yang ditingkatkan dan digabungkan dengan data.

Pelajari lebih lanjut

Lihat lebih banyak kode, notebook, informasi, dan diskusi tentang model RIG DataGemma di Kaggle.
Coba DataGemma menggunakan teknik pengambilan-berselang-seling untuk menjawab pertanyaan.
Coba DataGemma menggunakan teknik pengambilan yang ditingkatkan untuk menjawab pertanyaan.