โมเดล Gemini

ตัวแปรของโมเดล

Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้

ตัวแปรของโมเดล อินพุต เอาต์พุต เพิ่มประสิทธิภาพสำหรับ
Gemini 2.0 Flash
gemini-2.0-flash-exp
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ รูปภาพ (เร็วๆ นี้) และเสียง (เร็วๆ นี้) ฟีเจอร์ ความเร็ว และการสร้างแบบมัลติโมเดลรุ่นถัดไปสำหรับงานที่มีความหลากหลาย
Gemini 1.5 Flash
gemini-1.5-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานจำนวนมากและงานที่มีระดับปัญญาต่ำ
Gemini 1.5 Pro
gemini-1.5-pro
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น
(เลิกใช้งานแล้วในวันที่ 15/2/2025) Gemini 1.0 Pro
gemini-1.0-pro
ข้อความ ข้อความ งานภาษาธรรมชาติ แชทแบบข้อความและโค้ดแบบหลายรอบ รวมถึงการสร้างโค้ด
การฝังข้อความ
text-embedding-004
ข้อความ ข้อความที่ฝัง การวัดความเกี่ยวข้องของสตริงข้อความ
AQA
aqa
ข้อความ ข้อความ การให้คำตอบที่อิงตามแหล่งข้อมูล

(ทดลอง) Gemini 2.0 Flash

Gemini 2.0 Flash มาพร้อมฟีเจอร์รุ่นถัดไปและความสามารถที่ปรับปรุงแล้ว ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือในตัว การสร้างแบบหลายโมดัล และหน้าต่างบริบทขนาด 1 ล้านโทเค็น ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemini 2.0 Flash ในหน้าภาพรวม

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-2.0-flash-exp
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

เสียง (เร็วๆ นี้) รูปภาพ (เร็วๆ นี้) และข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

Rate limits[**]
  • 10 รอบต่อนาที
  • TPM 4 ล้านรายการ
  • 1,500 RPD
ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

ค้นหา

สิ่งที่ทำได้

การสร้างรูปภาพ

สิ่งที่ทำได้

การใช้เครื่องมือในเครื่อง

สิ่งที่ทำได้

การสร้างเสียง

สิ่งที่ทำได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-2.0-flash-exp
การอัปเดตล่าสุด ธันวาคม 2024

Gemini 1.5 Flash

Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดงานต่างๆ

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 9.5 ชั่วโมง

Rate limits[**]
ฟรี:
  • 15 รอบต่อนาที
  • TPM 1 ล้านรายการ
  • 1,500 RPD
Pay-as-you-go:
  • 2,000 รอบต่อนาที
  • TPM 4 ล้านรายการ
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-flash-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-flash
  • เวอร์ชันเสถียร
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
การอัปเดตล่าสุด กันยายน 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-flash-8b
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 9.5 ชั่วโมง

Rate limits[**]
ฟรี:
  • 15 รอบต่อนาที
  • TPM 1 ล้านรายการ
  • 1,500 RPD
Pay-as-you-go:
  • 4,000 รอบต่อนาที
  • TPM 4 ล้านรายการ
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-flash-8b-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-flash-8b
  • เวอร์ชันเสถียร
    • gemini-1.5-flash-8b-001
การอัปเดตล่าสุด ตุลาคม 2024

Gemini 1.5 Pro

Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-pro
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,097,152

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

7,200

ความยาววิดีโอสูงสุด

2 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 19 ชั่วโมง

Rate limits[**]
ฟรี:
  • 2 RPM
  • 32,000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1,000 รอบต่อนาที
  • TPM 4 ล้านรายการ
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-pro-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-pro
  • เวอร์ชันเสถียร
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
การอัปเดตล่าสุด กันยายน 2024

(เลิกใช้งานแล้ว) Gemini 1.0 Pro

Gemini 1.0 Pro เป็นโมเดล NLP ที่จัดการงานต่างๆ เช่น แชทแบบหลายรอบด้วยข้อความและโค้ด รวมถึงการสร้างโค้ด

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.0-pro
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความ

Rate limits[**]
ฟรี:
  • 15 รอบต่อนาที
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำไม่ได้

โหมด JSON

สิ่งที่ทำไม่ได้

สคีมา JSON

สิ่งที่ทำไม่ได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การกําหนดค่าการเรียกฟังก์ชัน

สิ่งที่ทำไม่ได้

การเรียกใช้โค้ด

สิ่งที่ทำไม่ได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
  • ล่าสุด: gemini-1.0-pro-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.0-pro
  • ทำงานได้อย่างเสถียร: gemini-1.0-pro-001
การอัปเดตล่าสุด กุมภาพันธ์ 2024

การฝังข้อความและการฝัง

การฝังข้อความ

การฝังข้อความใช้วัดความเกี่ยวข้องของสตริง และใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย

text-embedding-004 มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่ ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB

รายละเอียดรุ่น
พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น

Gemini API

models/text-embedding-004

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความที่ฝัง

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้และ สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด เมษายน 2024

การฝัง

คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความอินพุต

โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ

รายละเอียดการฝังโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/embedding-001
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความที่ฝัง

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้และ สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด ธันวาคม 2023

AQA

คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งข้อมูลที่ให้ไว้ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/aqa
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความ

ภาษาที่รองรับ อังกฤษ
ขีดจํากัดโทเค็น[*]

ขีดจํากัดโทเค็นอินพุต

7,168

ขีดจํากัดโทเค็นเอาต์พุต

1,024

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้และ สิ่งที่ทำได้
การอัปเดตล่าสุด ธันวาคม 2023

ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้

[*] โทเค็นจะเท่ากับประมาณ 4 อักขระสำหรับรุ่น Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ

[**] RPM: คำขอต่อนาที
TPM: โทเค็นต่อนาที
RPD: คำขอต่อวัน
TPD: โทเค็นต่อวัน

เราไม่รับประกันขีดจำกัดอัตราสูงสุดที่ระบุเนื่องจากข้อจำกัดด้านความสามารถ

รูปแบบชื่อเวอร์ชันโมเดล

โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้

  • ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้

    หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-latest เช่น gemini-1.0-pro-latest

  • เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ

    หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation> เช่น gemini-1.0-pro

  • เสถียร: ชี้ไปยังรุ่นเสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง

    หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-1.0-pro-001

  • ทดลอง: ชี้ไปยังโมเดลทดลองที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่ใช่เวอร์ชันที่ใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น มอบการอัปเดตล่าสุดให้แก่นักพัฒนาแอปอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการพัฒนานวัตกรรมที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จด้วย คุณสามารถเปลี่ยนโมเดลทดลองเป็นโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต

    หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-exp-1121

ภาษาที่พร้อมให้บริการ

โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้

  • อาหรับ (ar)
  • เบงกอล (bn)
  • บัลแกเรีย (bg)
  • จีนตัวย่อและตัวเต็ม (zh)
  • โครเอเชีย (hr)
  • เช็ก (cs)
  • เดนมาร์ก (da)
  • ดัตช์ (nl)
  • อังกฤษ (en)
  • เอสโตเนีย (et)
  • ฟินแลนด์ (fi)
  • ฝรั่งเศส (fr)
  • เยอรมัน (de)
  • กรีก (el)
  • ฮีบรู (iw)
  • ฮินดี (hi)
  • ฮังการี (hu)
  • อินโดนีเซีย (id)
  • อิตาลี (it)
  • ญี่ปุ่น (ja)
  • เกาหลี (ko)
  • ลัตเวีย (lv)
  • ลิทัวเนีย (lt)
  • นอร์เวย์ (no)
  • โปแลนด์ (pl)
  • โปรตุเกส (pt)
  • โรมาเนีย (ro)
  • รัสเซีย (ru)
  • เซอร์เบีย (sr)
  • สโลวัก (sk)
  • สโลวีเนีย (sl)
  • สเปน (es)
  • สวาฮิลี (sw)
  • สวีเดน (sv)
  • ไทย (th)
  • ตุรกี (tr)
  • ยูเครน (uk)
  • เวียดนาม (vi)