โมเดลของ Gemini

Gemini เป็นตระกูลโมเดล Generative AI ที่ช่วยให้นักพัฒนาซอฟต์แวร์สร้างเนื้อหาและแก้ไขปัญหาได้ โมเดลเหล่านี้ได้รับการออกแบบและฝึกให้จัดการ ทั้งข้อความและรูปภาพเป็นอินพุต คู่มือนี้ให้ข้อมูลเกี่ยวกับรายละเอียดปลีกย่อยของแต่ละรุ่น เพื่อช่วยให้คุณตัดสินใจเลือกรุ่นที่เหมาะกับการใช้งานของคุณมากที่สุด

ต่อไปนี้เป็นข้อมูลสรุปสั้นๆ ของโมเดลที่พร้อมใช้งานและความสามารถของโมเดลเหล่านั้น

รูปแบบ อินพุต เอาต์พุต
ราศีเมถุน
  • Gemini 1.5 Pro (เวอร์ชันตัวอย่างเท่านั้น)
ข้อความและรูปภาพ ข้อความ
  • Gemini 1.0 Pro
ข้อความ ข้อความ
  • วิสัยทัศน์ Gemini 1.0 Pro
ข้อความและรูปภาพ ข้อความ
การฝัง
  • การฝัง
ข้อความ การฝังข้อความ
การดึงข้อมูล
  • AQA
ข้อความ ข้อความ

ความปลอดภัยและการใช้งานตามจุดประสงค์

โมเดลปัญญาประดิษฐ์แบบ Generative เป็นเครื่องมือที่มีประสิทธิภาพ แต่ก็ยังมีข้อจำกัด ความคล่องตัวและประโยชน์ใช้สอยของผู้ใช้บางครั้งอาจนำไปสู่ผลลัพธ์ที่ไม่คาดคิด เช่น เอาต์พุตที่ไม่ถูกต้อง ลำเอียง หรือไม่เหมาะสม กระบวนการหลังการประมวลผลและการประเมินโดยเจ้าหน้าที่อย่างเข้มงวดเป็นสิ่งจำเป็นเพื่อจำกัดความเสี่ยงที่จะเป็นอันตรายจากผลลัพธ์ดังกล่าว ดูคำแนะนำเพิ่มเติมในการใช้งานที่ปลอดภัยได้ในคำแนะนำด้านความปลอดภัย

โมเดลที่ Gemini API มีให้จะใช้ได้สำหรับ Generative AI และแอปพลิเคชันการประมวลผลภาษาธรรมชาติ (NLP) ที่หลากหลาย การใช้งานฟังก์ชันเหล่านี้ใช้งานได้ผ่าน Gemini API หรือเว็บแอป Google AI Studio เท่านั้น การใช้ Gemini API ของคุณยังขึ้นอยู่กับนโยบายการใช้งานที่ไม่อนุญาตของ Generative AI และข้อกำหนดในการให้บริการของ Gemini API ด้วย

ขนาดโมเดล

ตารางต่อไปนี้แสดงขนาดที่มีจำหน่ายและความหมายของขนาดต่างๆ โดยเปรียบเทียบกัน

ขนาดโมเดล คำอธิบาย บริการ
Gemini 1.0 Pro ขนาดของโมเดลที่รักษาสมดุลระหว่างความสามารถและประสิทธิภาพ
  • ข้อความ
  • แชท

เวอร์ชันของโมเดล

รุ่น Gemini มีให้ใช้งานทั้งในเวอร์ชันตัวอย่างหรือเวอร์ชันเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลแบบใดแบบหนึ่งต่อไปนี้เพื่อระบุรุ่นและเวอร์ชันที่ต้องการใช้

  • ล่าสุด: ชี้ไปยังโมเดลอันล้ำสมัยสำหรับรุ่นและรูปแบบที่ระบุ โมเดลที่สำคัญจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง มีเพียงแอปทดสอบและต้นแบบสำหรับการทดสอบในการสำรวจเท่านั้นที่ควรใช้ชื่อแทนนี้

    หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้: <model>-<generation>-<variation>-latest ตัวอย่างเช่น gemini-1.0-pro-latest

  • เวอร์ชันเสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ

    หากต้องการระบุเวอร์ชันเสถียรล่าสุด ให้ใช้รูปแบบต่อไปนี้: <model>-<generation>-<variation> เช่น gemini-1.0-pro

  • เสถียร: ชี้ไปที่โมเดลที่มีความเสถียรที่เจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้โมเดลที่เสถียรโดยเฉพาะ

    หากต้องการระบุเวอร์ชันเสถียร ให้ใช้รูปแบบต่อไปนี้: <model>-<generation>-<variation>-<version> ตัวอย่างเช่น gemini-1.0-pro-001

สำหรับโมเดลที่มีเวอร์ชันเสถียร โปรดดูแถว "ชื่อโมเดล" ของโมเดลในรูปแบบต่างๆ ของโมเดล

รูปแบบที่ใกล้เคียง

Gemini API มีโมเดลต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานเฉพาะ ตารางต่อไปนี้จะอธิบายแอตทริบิวต์ของแต่ละแอตทริบิวต์

ความหลากหลาย แอตทริบิวต์ คำอธิบาย
Gemini 1.5 Pro (เวอร์ชันตัวอย่างเท่านั้น) อัปเดตโมเดลครั้งล่าสุด เมษายน 2024
รหัสรุ่น models/gemini-1.5-pro-latest
ความสามารถของโมเดล
  • อินพุต: เสียง รูปภาพ ข้อความ
  • เอาต์พุต: ข้อความ
  • เพิ่มประสิทธิภาพเพื่องานด้านภาษา เช่น
    • การสร้างโค้ด
    • การสร้างข้อความ
    • การแก้ไขข้อความ
    • การแก้ปัญหา
    • การสร้างคำแนะนำ
    • การดึงข้อมูล
    • การแยกหรือการสร้างข้อมูล
    • Agent ของ AI
  • สามารถจัดการงานแบบ 0, 1 และ 2-3 ช็อตได้
วิธีการสร้างที่รองรับ generateContent
ขีดจำกัดโทเค็นอินพุต 1048576
ขีดจำกัดโทเค็นเอาต์พุต 8192
ความปลอดภัยของโมเดล การตั้งค่าความปลอดภัยที่ใช้โดยอัตโนมัติซึ่งนักพัฒนาแอปปรับได้ ดูรายละเอียดในหัวข้อการตั้งค่าความปลอดภัย
ขีดจำกัดอัตรา 2 คำค้นหาต่อนาที, 1,000 คำค้นหาต่อวัน [1]
Gemini Pro อัปเดตโมเดลครั้งล่าสุด February 2024
รหัสรุ่น models/gemini-pro
ความสามารถของโมเดล
  • อินพุต: ข้อความ
  • เอาต์พุต: ข้อความ
  • สร้างข้อความ
  • สามารถจัดการรูปแบบการสนทนาแบบมัลติเทิร์น
  • สามารถจัดการงานแบบ 0, 1 และ 2-3 ช็อตได้
วิธีการสร้างที่รองรับ generateContent
ขีดจำกัดโทเค็นอินพุต 30720
ขีดจำกัดโทเค็นเอาต์พุต 2048
ความปลอดภัยของโมเดล การตั้งค่าความปลอดภัยที่ใช้โดยอัตโนมัติซึ่งนักพัฒนาแอปปรับได้ ดูรายละเอียดในหัวข้อการตั้งค่าความปลอดภัย
ขีดจำกัดอัตรา 60 คำขอต่อนาที [1]
ชื่อโมเดล
  • เวอร์ชันล่าสุด: gemini-1.0-pro-latest
  • เวอร์ชันเสถียรล่าสุด: gemini-1.0-pro
  • เวอร์ชันเสถียร:
    • gemini-1.0-pro-001
วิสัยทัศน์ Gemini 1.0 Pro อัปเดตโมเดลครั้งล่าสุด ธันวาคม 2023
รหัสรุ่น models/gemini-pro-vision
ความสามารถของโมเดล
  • ข้อมูลที่ป้อน: ข้อความและรูปภาพ
  • เอาต์พุต: ข้อความ
  • รับอินพุตแบบหลายโมดัล ข้อความ และรูปภาพได้
  • สามารถจัดการงานแบบ 0, 1 และ 2-3 ช็อตได้
วิธีการสร้างที่รองรับ generateContent
ขีดจำกัดโทเค็นอินพุต 12288
ขีดจำกัดโทเค็นเอาต์พุต 4096
ความปลอดภัยของโมเดล การตั้งค่าความปลอดภัยที่ใช้โดยอัตโนมัติซึ่งนักพัฒนาแอปปรับได้ ดูรายละเอียดในหัวข้อการตั้งค่าความปลอดภัย
ขีดจำกัดอัตรา 60 คำขอต่อนาที [1]
การฝัง อัปเดตโมเดลครั้งล่าสุด ธันวาคม 2023
รหัสรุ่น models/embedding-001
ความสามารถของโมเดล
  • อินพุต: ข้อความ
  • เอาต์พุต: ข้อความ
  • สร้างการฝังข้อความสำหรับข้อความอินพุต
  • เหมาะสำหรับการสร้างการฝังสำหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ
วิธีการสร้างที่รองรับ embedContent
ความปลอดภัยของโมเดล ไม่มีการตั้งค่าความปลอดภัยที่ปรับแต่งได้
ขีดจำกัดอัตรา คำขอ 1,500 รายการต่อนาที [1]
การฝังข้อความ อัปเดตโมเดลครั้งล่าสุด เมษายน 2024
รหัสรุ่น models/text-embedding-004 (text-embedding-preview-0409 ใน Vertex AI)
ความสามารถของโมเดล
  • อินพุต: ข้อความ
  • เอาต์พุต: ข้อความ
  • สร้างการฝังข้อความสำหรับข้อความอินพุต
  • รองรับขนาดการฝังที่ยืดหยุ่นที่มีอายุต่ำกว่า 768
วิธีการสร้างที่รองรับ embedContent
ความปลอดภัยของโมเดล ไม่มีการตั้งค่าความปลอดภัยที่ปรับแต่งได้
ขีดจำกัดอัตรา คำขอ 1,500 รายการต่อนาที [1]
AQA อัปเดตโมเดลครั้งล่าสุด ธันวาคม 2023
รหัสรุ่น models/aqa
ความสามารถของโมเดล
  • อินพุต: ข้อความ
  • เอาต์พุต: ข้อความ
  • โมเดลที่ดำเนินการตอบคำถามที่มีการระบุแหล่งที่มา
  • โมเดลที่ฝึกให้ส่งคืนคำตอบสำหรับคำถามที่มีพื้นฐานมาจากแหล่งที่มาที่ให้ไว้ พร้อมกับการประมาณความน่าจะเป็นที่ตอบได้
วิธีการสร้างที่รองรับ generateAnswer
ภาษาที่รองรับ อังกฤษ
ขีดจำกัดโทเค็นอินพุต 7168
ขีดจำกัดโทเค็นเอาต์พุต 1024
ความปลอดภัยของโมเดล การตั้งค่าความปลอดภัยที่ใช้โดยอัตโนมัติซึ่งนักพัฒนาแอปปรับได้ ดูรายละเอียดในหัวข้อการตั้งค่าความปลอดภัย
ขีดจำกัดอัตรา 60 คำขอต่อนาที [1]

ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบรูปแบบต่างๆ เหล่านี้

ข้อมูลเมตาของโมเดล

ใช้ ModelService API เพื่อรับข้อมูลเมตาเพิ่มเติมเกี่ยวกับโมเดลล่าสุด เช่น ขีดจำกัดโทเค็นอินพุตและเอาต์พุต ตารางต่อไปนี้แสดงข้อมูลเมตาสำหรับตัวแปรของรุ่น Gemini Pro

แอตทริบิวต์ ค่า
ชื่อที่แสดง Gemini 1.0 Pro
รหัสรุ่น models/gemini-1.0-pro
คำอธิบาย โมเดลที่กำหนดเป้าหมายสำหรับการสร้างข้อความ
วิธีการสร้างที่รองรับ generateContent
อุณหภูมิ 0.9
top_p 1
top_k 1

แอตทริบิวต์ของโมเดล

ตารางต่อไปนี้อธิบายแอตทริบิวต์ของโมเดล Gemini ซึ่งพบได้ในรูปแบบโมเดลทั้งหมด

แอตทริบิวต์ คำอธิบาย
ข้อมูลการฝึก จุดตัดความรู้ของ Gemini คือช่วงต้นปี 2023 ความรู้เกี่ยวกับเหตุการณ์หลังจากเวลาดังกล่าวมีจำกัด
ภาษาที่รองรับ ดูภาษาที่ใช้ได้
พารามิเตอร์โมเดลที่กำหนดค่าได้
  • ตำแหน่งบนสุด
  • เพลงอันดับสูงสุด
  • อุณหภูมิ
  • หยุดลำดับ
  • ความยาวเอาต์พุตสูงสุด
  • จำนวนผู้ตอบแบบสอบถาม

[1] เนื่องจากขีดจำกัดความจุ ระบบจะไม่รับประกันขีดจำกัดอัตราสูงสุดที่ระบุไว้

ดูข้อมูลเกี่ยวกับพารามิเตอร์แต่ละรายการได้ในส่วนพารามิเตอร์โมเดลของ ข้อมูลเบื้องต้นเกี่ยวกับคู่มือ LLM

ขั้นตอนถัดไป