รูปแบบของ Gemini

ตัวแปรของโมเดล

Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้

ตัวแปรของโมเดล อินพุต เอาต์พุต เพิ่มประสิทธิภาพสำหรับ
Gemini 2.0 Flash
gemini-2.0-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ รูปภาพ (เร็วๆ นี้) และเสียง (เร็วๆ นี้) ฟีเจอร์ ความเร็ว และการสร้างแบบมัลติโมเดลรุ่นถัดไปสำหรับงานที่มีความหลากหลาย
ตัวอย่าง Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อประหยัดต้นทุนและเวลาในการตอบสนองต่ำ
Gemini 1.5 Flash
gemini-1.5-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานจำนวนมากและงานที่มีระดับปัญญาต่ำ
Gemini 1.5 Pro
gemini-1.5-pro
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น
Gemini 1.0 Pro
gemini-1.0-pro
(เลิกใช้งานแล้วในวันที่ 15/2/2025)
ข้อความ ข้อความ งานภาษาธรรมชาติ แชทแบบข้อความและโค้ดแบบหลายรอบ รวมถึงการสร้างโค้ด
การฝังข้อความ
text-embedding-004
ข้อความ ข้อความที่ฝัง การวัดความเกี่ยวข้องของสตริงข้อความ
AQA
aqa
ข้อความ ข้อความ การให้คำตอบที่อิงตามแหล่งข้อมูล

Gemini 2.0 Flash

Gemini 2.0 Flash มาพร้อมฟีเจอร์และความสามารถรุ่นถัดไปที่ปรับปรุงประสิทธิภาพให้ดียิ่งขึ้น ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือแบบเนทีฟ การสร้างแบบหลายโมดัล และหน้าต่างบริบทขนาด 1 ล้านโทเค็น

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-2.0-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

เสียง (เร็วๆ นี้) รูปภาพ (เร็วๆ นี้) และข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

Rate limits[**]
  • 2,000 รอบต่อนาที
  • 4,000,000 TPM
ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

เร็วๆ นี้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

ค้นหา

สิ่งที่ทำได้

การสร้างรูปภาพ

เร็วๆ นี้

การใช้เครื่องมือในเครื่อง

สิ่งที่ทำได้

การสร้างเสียง

เร็วๆ นี้

Multimodal Live API

เร็วๆ นี้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-2.0-flash
  • ทำงานได้อย่างเสถียร: gemini-2.0-flash-001
การอัปเดตล่าสุด กุมภาพันธ์ 2025
Knowledge cutoff สิงหาคม 2024

เวอร์ชันตัวอย่าง Gemini 2.0 Flash-Lite

โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อประหยัดต้นทุนและเวลาในการตอบสนองต่ำ

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-2.0-flash-lite-preview-02-05
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

Rate limits[**]
  • 10 รอบต่อนาที
  • 4,000,000 TPM
  • 1,500 RPD
ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำไม่ได้

การเรียกใช้โค้ด

สิ่งที่ทำไม่ได้

ค้นหา

สิ่งที่ทำไม่ได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การใช้เครื่องมือในเครื่อง

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Multimodal Live API

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-2.0-flash-lite-preview-02-05
การอัปเดตล่าสุด กุมภาพันธ์ 2025
Knowledge cutoff สิงหาคม 2024

Gemini 1.5 Flash

Gemini 1.5 Flash เป็นโมเดลสื่อหลายรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดงานต่างๆ

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 9.5 ชั่วโมง

Rate limits[**]
ฟรี:
  • 15 รอบต่อนาที
  • TPM 1 ล้านรายการ
  • 1,500 RPD
Pay-as-you-go:
  • 2,000 รอบต่อนาที
  • TPM 4 ล้านรายการ
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-flash-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-flash
  • เวอร์ชันเสถียร
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
การอัปเดตล่าสุด กันยายน 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-flash-8b
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 9.5 ชั่วโมง

Rate limits[**]
ฟรี:
  • 15 รอบต่อนาที
  • TPM 1 ล้านรายการ
  • 1,500 RPD
Pay-as-you-go:
  • 4,000 รอบต่อนาที
  • TPM 4 ล้านรายการ
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-flash-8b-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-flash-8b
  • เวอร์ชันเสถียร
    • gemini-1.5-flash-8b-001
การอัปเดตล่าสุด ตุลาคม 2024

Gemini 1.5 Pro

Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-pro
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,097,152

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

7,200

ความยาววิดีโอสูงสุด

2 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 19 ชั่วโมง

Rate limits[**]
ฟรี:
  • 2 RPM
  • 32,000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1,000 รอบต่อนาที
  • TPM 4 ล้านรายการ
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมในรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-pro-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-pro
  • เวอร์ชันเสถียร
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
การอัปเดตล่าสุด กันยายน 2024

Gemini 1.0 Pro (เลิกใช้งานแล้ว)

Gemini 1.0 Pro เป็นโมเดล NLP ที่จัดการงานต่างๆ เช่น แชทข้อความและโค้ดแบบหลายรอบ รวมถึงการสร้างโค้ด

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.0-pro
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความ

Rate limits[**]
ฟรี:
  • 15 รอบต่อนาที
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำไม่ได้

โหมด JSON

สิ่งที่ทำไม่ได้

สคีมา JSON

สิ่งที่ทำไม่ได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การกำหนดค่าการเรียกฟังก์ชัน

สิ่งที่ทำไม่ได้

การเรียกใช้โค้ด

สิ่งที่ทำไม่ได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
  • ล่าสุด: gemini-1.0-pro-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.0-pro
  • ทำงานได้อย่างเสถียร: gemini-1.0-pro-001
การอัปเดตล่าสุด กุมภาพันธ์ 2024

การฝังข้อความและการฝัง

การฝังข้อความ

การฝังข้อความใช้วัดความเกี่ยวข้องของสตริงและใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย

text-embedding-004 มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่ ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB

รายละเอียดรุ่น
พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น

Gemini API

models/text-embedding-004

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความที่ฝัง

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด เมษายน 2024

การฝัง

คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความที่ป้อน

โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ

รายละเอียดการฝังโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/embedding-001
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความที่ฝัง

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด ธันวาคม 2023

AQA

คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งที่มาที่ระบุ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/aqa
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความ

ภาษาที่รองรับ อังกฤษ
ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

7,168

ขีดจํากัดโทเค็นเอาต์พุต

1,024

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง สิ่งที่ทำได้
การอัปเดตล่าสุด ธันวาคม 2023

ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้

[*] โทเค็นจะเท่ากับประมาณ 4 อักขระสำหรับรุ่น Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ

[**] RPM: คำขอต่อนาที
TPM: โทเค็นต่อนาที
RPD: คำขอต่อวัน
TPD: โทเค็นต่อวัน

เราไม่รับประกันขีดจำกัดอัตราสูงสุดที่ระบุเนื่องจากข้อจำกัดด้านความจุ

รูปแบบชื่อเวอร์ชันโมเดล

โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้

  • ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้

    หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-latest เช่น gemini-1.0-pro-latest

  • เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ

    หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation> เช่น gemini-1.0-pro

  • เสถียร: ชี้ไปยังรุ่นเสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง

    หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-1.0-pro-001

  • ทดลอง: ชี้ไปยังโมเดลทดลองที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่ใช่เวอร์ชันที่ใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ช่วยให้นักพัฒนาแอปได้รับอัปเดตล่าสุดอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการสร้างสรรค์นวัตกรรมที่เกิดขึ้นที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จด้วย คุณสามารถเปลี่ยนโมเดลทดลองเป็นโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต

    หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-exp-1121

ภาษาที่พร้อมให้บริการ

โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้

  • อาหรับ (ar)
  • เบงกอล (bn)
  • บัลแกเรีย (bg)
  • จีนตัวย่อและตัวเต็ม (zh)
  • โครเอเชีย (hr)
  • เช็ก (cs)
  • เดนมาร์ก (da)
  • ดัตช์ (nl)
  • อังกฤษ (en)
  • เอสโตเนีย (et)
  • ฟินแลนด์ (fi)
  • ฝรั่งเศส (fr)
  • เยอรมัน (de)
  • กรีก (el)
  • ฮีบรู (iw)
  • ฮินดี (hi)
  • ฮังการี (hu)
  • อินโดนีเซีย (id)
  • อิตาลี (it)
  • ญี่ปุ่น (ja)
  • เกาหลี (ko)
  • ลัตเวีย (lv)
  • ลิทัวเนีย (lt)
  • นอร์เวย์ (no)
  • โปแลนด์ (pl)
  • โปรตุเกส (pt)
  • โรมาเนีย (ro)
  • รัสเซีย (ru)
  • เซอร์เบีย (sr)
  • สโลวัก (sk)
  • สโลวีเนีย (sl)
  • สเปน (es)
  • สวาฮิลี (sw)
  • สวีเดน (sv)
  • ไทย (th)
  • ตุรกี (tr)
  • ยูเครน (uk)
  • เวียดนาม (vi)