2.0 Flash
โมเดลสื่อหลายรูปแบบใหม่ล่าสุดของเราที่มีฟีเจอร์และความสามารถรุ่นถัดไปที่ปรับปรุงแล้ว
- ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบที่เป็นข้อความ รูปภาพ และเสียง
- มีการโต้ตอบแบบสนทนาที่ใช้เวลาในการตอบสนองต่ำด้วย Multimodal Live API
ตัวแปรของโมเดล
Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้
ตัวแปรของโมเดล | อินพุต | เอาต์พุต | เพิ่มประสิทธิภาพสำหรับ |
---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash-exp |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ รูปภาพ (เร็วๆ นี้) และเสียง (เร็วๆ นี้) | ฟีเจอร์ ความเร็ว และการสร้างแบบมัลติโมเดลรุ่นถัดไปสำหรับงานที่มีความหลากหลาย |
Gemini 1.5 Flash
gemini-1.5-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานจำนวนมากและงานที่มีระดับปัญญาต่ำ |
Gemini 1.5 Pro
gemini-1.5-pro |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น |
(เลิกใช้งานแล้วในวันที่ 15/2/2025) Gemini 1.0 Pro
gemini-1.0-pro |
ข้อความ | ข้อความ | งานภาษาธรรมชาติ แชทแบบข้อความและโค้ดแบบหลายรอบ รวมถึงการสร้างโค้ด |
การฝังข้อความ
text-embedding-004 |
ข้อความ | ข้อความที่ฝัง | การวัดความเกี่ยวข้องของสตริงข้อความ |
AQA
aqa |
ข้อความ | ข้อความ | การให้คำตอบที่อิงตามแหล่งข้อมูล |
(ทดลอง) Gemini 2.0 Flash
Gemini 2.0 Flash มาพร้อมฟีเจอร์รุ่นถัดไปและความสามารถที่ปรับปรุงแล้ว ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือในตัว การสร้างแบบหลายโมดัล และหน้าต่างบริบทขนาด 1 ล้านโทเค็น ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemini 2.0 Flash ในหน้าภาพรวม
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-2.0-flash-exp |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต เสียง (เร็วๆ นี้) รูปภาพ (เร็วๆ นี้) และข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
[**] | Rate limits
|
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ สิ่งที่ทำได้ การใช้เครื่องมือในเครื่อง สิ่งที่ทำได้ การสร้างเสียง สิ่งที่ทำได้ |
Versions |
|
การอัปเดตล่าสุด | ธันวาคม 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดงานต่างๆ
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กันยายน 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-flash-8b |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | ตุลาคม 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 2,097,152 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 7,200 ความยาววิดีโอสูงสุด 2 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 19 ชั่วโมง |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กันยายน 2024 |
(เลิกใช้งานแล้ว) Gemini 1.0 Pro
Gemini 1.0 Pro เป็นโมเดล NLP ที่จัดการงานต่างๆ เช่น แชทแบบหลายรอบด้วยข้อความและโค้ด รวมถึงการสร้างโค้ด
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.0-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความ |
[**] | Rate limits
|
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำไม่ได้ โหมด JSON สิ่งที่ทำไม่ได้ สคีมา JSON สิ่งที่ทำไม่ได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การกําหนดค่าการเรียกฟังก์ชัน สิ่งที่ทำไม่ได้ การเรียกใช้โค้ด สิ่งที่ทำไม่ได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กุมภาพันธ์ 2024 |
การฝังข้อความและการฝัง
การฝังข้อความ
การฝังข้อความใช้วัดความเกี่ยวข้องของสตริง และใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย
text-embedding-004
มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่
ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้และ | สิ่งที่ทำไม่ได้ |
การอัปเดตล่าสุด | เมษายน 2024 |
การฝัง
คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความอินพุต
โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ
รายละเอียดการฝังโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น |
models/embedding-001
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้และ | สิ่งที่ทำไม่ได้ |
การอัปเดตล่าสุด | ธันวาคม 2023 |
AQA
คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งข้อมูลที่ให้ไว้ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/aqa |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความ |
ภาษาที่รองรับ | อังกฤษ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดโทเค็นอินพุต 7,168 ขีดจํากัดโทเค็นเอาต์พุต 1,024 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้และ | สิ่งที่ทำได้ |
การอัปเดตล่าสุด | ธันวาคม 2023 |
ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้
[*] โทเค็นจะเท่ากับประมาณ 4 อักขระสำหรับรุ่น Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ
[**] RPM: คำขอต่อนาที
TPM: โทเค็นต่อนาที
RPD: คำขอต่อวัน
TPD: โทเค็นต่อวัน
เราไม่รับประกันขีดจำกัดอัตราสูงสุดที่ระบุเนื่องจากข้อจำกัดด้านความสามารถ
รูปแบบชื่อเวอร์ชันโมเดล
โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้
ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้
หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-latest
เช่นgemini-1.0-pro-latest
เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ
หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>
เช่นgemini-1.0-pro
เสถียร: ชี้ไปยังรุ่นเสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง
หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่นgemini-1.0-pro-001
ทดลอง: ชี้ไปยังโมเดลทดลองที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่ใช่เวอร์ชันที่ใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น มอบการอัปเดตล่าสุดให้แก่นักพัฒนาแอปอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการพัฒนานวัตกรรมที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จด้วย คุณสามารถเปลี่ยนโมเดลทดลองเป็นโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต
หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่นgemini-exp-1121
ภาษาที่พร้อมให้บริการ
โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้
- อาหรับ (
ar
) - เบงกอล (
bn
) - บัลแกเรีย (
bg
) - จีนตัวย่อและตัวเต็ม (
zh
) - โครเอเชีย (
hr
) - เช็ก (
cs
) - เดนมาร์ก (
da
) - ดัตช์ (
nl
) - อังกฤษ (
en
) - เอสโตเนีย (
et
) - ฟินแลนด์ (
fi
) - ฝรั่งเศส (
fr
) - เยอรมัน (
de
) - กรีก (
el
) - ฮีบรู (
iw
) - ฮินดี (
hi
) - ฮังการี (
hu
) - อินโดนีเซีย (
id
) - อิตาลี (
it
) - ญี่ปุ่น (
ja
) - เกาหลี (
ko
) - ลัตเวีย (
lv
) - ลิทัวเนีย (
lt
) - นอร์เวย์ (
no
) - โปแลนด์ (
pl
) - โปรตุเกส (
pt
) - โรมาเนีย (
ro
) - รัสเซีย (
ru
) - เซอร์เบีย (
sr
) - สโลวัก (
sk
) - สโลวีเนีย (
sl
) - สเปน (
es
) - สวาฮิลี (
sw
) - สวีเดน (
sv
) - ไทย (
th
) - ตุรกี (
tr
) - ยูเครน (
uk
) - เวียดนาม (
vi
)