DataGemma

DataGemma คือเครื่องมือวิจัยที่ให้ผู้ใช้ถามคำถามด้วยภาษาง่ายๆ และรับ คำตอบที่อิงจากข้อมูลสถิติที่เปิดเผยต่อสาธารณะใน Data Commons เครื่องมือจะใช้ Gemma เวอร์ชันที่สร้างขึ้นเป็นพิเศษ Gemini API ที่มาพร้อม Gemini 1.5 Pro และชุดไลบรารี ที่ออกแบบมาเพื่อทำงานกับ Data Commons โดยเฉพาะ

เครื่องมือวิจัยนี้มีเทคนิค 2 อย่างในการตอบคำถามตามข้อมูล ข้อมูลทางสถิติทั่วไป:

  • การดึงข้อมูลแบบแทรกสลับ (RIG) - วิธีนี้ใช้ตัวแปรของ Gemma 2 ที่มีการปรับแต่งเพื่อให้จดจำได้เมื่อต้องการแทนที่ตัวเลขที่สร้างขึ้นด้วย ที่ถูกต้องแม่นยำมากขึ้นจาก Data Commons ดูรายละเอียดเพิ่มเติมได้ที่ Colab สมุดบันทึก และโมเดลใน Kaggle หรือ กอดใบหน้า
  • การสร้างที่เพิ่มการดึงข้อมูล (RAG) - แนวทางนี้ใช้ตัวแปรของ Gemma 2 ที่ดึงข้อมูลที่เกี่ยวข้องจาก Data Commons แล้วใช้ข้อมูลดังกล่าวเพื่อสร้างพรอมต์แบบขยายสำหรับโมเดล Gemini 1.5 Pro ดูรายละเอียดเพิ่มเติมได้ที่ โคลัมเบีย สมุดบันทึก และโมเดลใน Kaggle หรือ กอดใบหน้า

สำหรับการวิจัยและรายละเอียดทางเทคนิคเพิ่มเติมเกี่ยวกับ DataGemma โปรดดูที่ เอกสารทางเทคนิคของ DataGemma

  • ใช้ปัญญาประดิษฐ์ (AI) แบบ Generative กับที่เก็บข้อมูลทางสถิติสาธารณะขนาดใหญ่เพื่อสำรวจและค้นพบข้อมูลเชิงลึกใหม่ๆ
  • สำรวจวิธีกำหนดทิศทางเอาต์พุตของโมเดล Generative AI ด้วยเทคนิคการเสริมแต่งการดึงข้อมูลและการใส่ข้อมูล

ดูข้อมูลเพิ่มเติม

ดูโค้ด สมุดบันทึก ข้อมูล และการสนทนาเพิ่มเติมเกี่ยวกับโมเดล DataGemma RIG ใน Kaggle
ลองใช้ DataGemma โดยใช้เทคนิคการดึงข้อมูลด้วยการสอดแทรกเพื่อตอบคำถาม
ลองใช้ DataGemma โดยใช้เทคนิคการเสริมการเรียกเพื่อตอบคำถาม