ตอนนี้ Interactions API พร้อมให้บริการแก่ผู้ใช้ทั่วไปแล้ว เราขอแนะนำให้ใช้ API นี้เพื่อเข้าถึงฟีเจอร์และโมเดลล่าสุดทั้งหมด

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

โมเดล

Gemini 3

Gemini 3.1 Pro

ความสามารถด้านปัญญาประดิษฐ์ขั้นสูง ทักษะการแก้ปัญหาที่ซับซ้อน และความสามารถในการเขียนโค้ดแบบ Agent และ Vibe Coding ที่ทรงประสิทธิภาพ

Preview

Gemini 3.5 Flash

โมเดลที่ชาญฉลาดที่สุดสำหรับประสิทธิภาพการทำงานที่ล้ำสมัยอย่างต่อเนื่องในงานแบบ Agent และงานเขียนโค้ด

เสถียร

Gemini 3 Flash

ประสิทธิภาพระดับล้ำสมัยเทียบเท่าโมเดลขนาดใหญ่กว่าในราคาที่ถูกกว่ามาก

Preview

Gemini 3.1 Flash-Lite

เสถียร

Nano Banana 2

การสร้างและแก้ไขรูปภาพที่มีประสิทธิภาพสูงและมีประสิทธิภาพการทำงานสูง ซึ่งปรับให้เหมาะกับกรณีการใช้งานที่เน้นความเร็วและปริมาณมาก

เสถียร

Nano Banana Pro

โมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัยสำหรับการสร้างรูปภาพแบบเนทีฟที่มีบริบทสูง

เสถียร

Gemini 3.5 Live Translate

โมเดลการแปลเสียงพูดเป็นเสียงพูดแบบเรียลไทม์ที่มีเวลาในการตอบสนองต่ำ ซึ่งรองรับมากกว่า 70 ภาษา

เวอร์ชันตัวอย่าง ใหม่

Gemini 3.1 Flash Live

โมเดล Live API คุณภาพสูงที่มีเวลาในการตอบสนองต่ำสำหรับการสนทนาแบบเรียลไทม์และแอปพลิเคชัน AI ที่ใช้เสียงเป็นหลัก

เวอร์ชันตัวอย่าง ใหม่

Gemini 3.1 Flash TTS

การสร้างเสียงพูดที่ทรงประสิทธิภาพและมีเวลาในการตอบสนองต่ำ

เวอร์ชันตัวอย่าง ใหม่

Gemini 2.5 Flash

โมเดลที่มีประสิทธิภาพคุ้มค่าที่สุดของเราสำหรับงานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้การให้เหตุผล

Nano Banana

การสร้างและแก้ไขรูปภาพแบบเนทีฟที่ล้ำสมัยซึ่งออกแบบมาสำหรับเวิร์กโฟลว์ที่รวดเร็วและสร้างสรรค์

Gemini 2.5 Flash Live Live (เวอร์ชันตัวอย่าง)

ปรับให้เหมาะกับเอเจนต์การสนทนาแบบเรียลไทม์ที่มีการสตรีมเสียงแบบเนทีฟที่ใช้เวลาน้อยกว่า 1 วินาที

Gemini 2.5 Flash TTS (เวอร์ชันตัวอย่าง)

การสร้างเสียงอ่านข้อความออกเสียงที่ควบคุมได้พร้อมการควบคุมสไตล์และจังหวะอย่างละเอียด

Gemini 2.5 Flash-Lite

โมเดลหลายรูปแบบที่เร็วที่สุดและคุ้มค่าที่สุดในตระกูล 2.5

Gemini 2.5 Pro

โมเดลขั้นสูงที่สุดของเราสำหรับงานที่ซับซ้อน ซึ่งมีความสามารถในการให้เหตุผลและการเขียนโค้ดอย่างละเอียด

Gemini 2.5 Pro TTS (เวอร์ชันตัวอย่าง)

การสังเคราะห์เสียงพูดแบบรายละเอียดเสมือนจริงสูงซึ่งปรับให้เหมาะกับคุณภาพในเวิร์กโฟลว์ที่มีโครงสร้าง เช่น พอดแคสต์และหนังสือเสียง

โมเดลเสียง

ส่วนนี้มีโมเดลเสียงทั้งหมด รวมถึงโมเดลที่อาจแสดงอยู่ในส่วนอื่นๆ แล้ว

Gemini 3.1 Flash Live Preview

โมเดลเสียงเป็นเสียง (A2A) คุณภาพสูงที่มีเวลาในการตอบสนองต่ำ ซึ่งออกแบบมาสำหรับการสนทนาแบบเรียลไทม์และแอปพลิเคชัน AI ที่ใช้เสียงเป็นหลัก

Gemini 3.1 Flash TTS Preview

การสร้างเสียงพูดที่ทรงประสิทธิภาพและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแสดงอารมณ์ใหม่สำหรับการควบคุมการบรรยายที่แม่นยำ

Gemini 2.5 Flash Live Live (เวอร์ชันตัวอย่าง)

โมเดล Live API หลักของเราสำหรับเอเจนต์เสียงและวิดีโอแบบสองทิศทางที่มีเวลาในการตอบสนองต่ำพร้อมการให้เหตุผลด้วยเสียงแบบเนทีฟ

Gemini 2.5 Flash TTS (เวอร์ชันตัวอย่าง)

การอ่านข้อความออกเสียงที่รวดเร็วและควบคุมได้สำหรับแอปพลิเคชันที่มีเวลาในการตอบสนองต่ำและคุ้มค่า รวมถึงผู้ช่วยแบบเรียลไทม์

Gemini 2.5 Pro TTS (เวอร์ชันตัวอย่าง)

โมเดล GenMedia

ส่วนนี้มีโมเดล GenMedia ทั้งหมด รวมถึงโมเดลที่อาจแสดงอยู่ในส่วนอื่นๆ แล้ว

Nano Banana 2

การสร้างภาพขนาดใหญ่ที่มีประสิทธิภาพสูง ซึ่งผสานรวมความสามารถของ Gemini 3 Series เข้ากับความเร็วในการสร้างที่รวดเร็ว

Veo 3.1 (เวอร์ชันตัวอย่าง)

การสร้างวิดีโอสไตล์ภาพยนตร์ที่ล้ำสมัยพร้อมการควบคุมการสร้างสรรค์ขั้นสูงและเสียงที่ซิงโครไนซ์แบบเนทีฟ

Nano Banana Pro

เอนจินการออกแบบระดับมืออาชีพที่มีแกนการให้เหตุผลสำหรับภาพคุณภาพระดับสตูดิโอ 4K, เลย์เอาต์ที่ซับซ้อน และการแสดงข้อความที่แม่นยำ

Veo 3.1 Lite (เวอร์ชันตัวอย่าง)

การสร้างและแก้ไขวิดีโอ รวมถึงการควบคุมสไตล์ภาพยนตร์ที่มีประสิทธิภาพสูง ต้นทุนต่ำ และเน้นนักพัฒนาซอฟต์แวร์เป็นหลักจากตระกูล Veo 3.1

Imagen 4

โมเดลเปลี่ยนข้อความเป็นรูปภาพที่เร็วที่สุดและเร็วมากที่สุดของเรา พร้อมความคมชัดที่ยอดเยี่ยมสูงสุดที่ความละเอียด 2K

โมเดลการสร้างเสียงดนตรี

ส่วนนี้มีโมเดลการสร้างเสียงดนตรีทั้งหมด รวมถึงโมเดลที่อาจแสดงอยู่ในส่วนอื่นๆ แล้ว

Lyria 3 Pro (เวอร์ชันตัวอย่าง)

โมเดลการสร้างเสียงดนตรีหลักของเรา ซึ่งปรับให้เหมาะกับเพลงเต็มรูปแบบที่มีความสอดคล้องของโครงสร้างที่ซับซ้อน

Lyria 3 Clip (เวอร์ชันตัวอย่าง)

ปรับให้เหมาะกับการสร้างคลิปดนตรีสั้นๆ ลูป และตัวอย่างความยาวสูงสุด 30 วินาที

Lyria RealTime (เวอร์ชันทดลอง)

โมเดลการสร้างเสียงดนตรีแบบรายละเอียดเสมือนจริงสูงซึ่งให้การควบคุมการสร้างสรรค์แบบละเอียดและความสามารถในการสตรีมแบบเรียลไทม์

โมเดลเครื่องมือและโมเดล Agent

การใช้คอมพิวเตอร์ เวอร์ชันตัวอย่าง

โมเดลเฉพาะที่ "มองเห็น" หน้าจอดิจิทัลและดำเนินการ UI เช่น การคลิก การพิมพ์ และการไปยังส่วนต่างๆ เพื่อทำให้งานเบราว์เซอร์ที่ซับซ้อนเป็นแบบอัตโนมัติ

Gemini Deep Research (เวอร์ชันตัวอย่าง)

โมเดลแบบ Agent ที่วางแผนและดำเนินการวิจัยหลายขั้นตอนในแหล่งข้อมูลหลายร้อยแห่งโดยอัตโนมัติเพื่อสร้างรายงานแบบโต้ตอบที่มีการอ้างอิง

Gemini Deep Research Max (เวอร์ชันตัวอย่าง)

ความครอบคลุมสูงสุดสำหรับการรวบรวมและสังเคราะห์บริบทแบบอัตโนมัติจากแหล่งข้อมูลหลายร้อยแห่ง

Antigravity Agent (เวอร์ชันตัวอย่าง)

Agent ที่มีการจัดการแบบอเนกประสงค์ซึ่งวางแผน ให้เหตุผล เรียกใช้โค้ด จัดการไฟล์ และท่องเว็บโดยอัตโนมัติภายในแซนด์บ็อกซ์ Linux ที่ปลอดภัยและแยกจากกัน

โมเดลงานเฉพาะ

Gemini Embedding 2

โมเดลการฝังหลายรูปแบบแรกของเรา ซึ่งแมปข้อความ รูปภาพ วิดีโอ เสียง และ PDF ลงในพื้นที่การฝังแบบรวมสำหรับการค้นหาเชิงความหมายขั้นสูงและระบบ RAG

Gemini Embedding

การแสดงเวกเตอร์แบบหลายมิติสำหรับการค้นหาเชิงความหมายขั้นสูง การจัดประเภทข้อความ และระบบ RAG

Gemini Robotics-ER 1.6(เวอร์ชันตัวอย่าง)

โมเดลการให้เหตุผลแบบฝังตัวขั้นสูงที่เข้าใจพื้นที่ทางกายภาพและวางแผนงานหลายขั้นตอนสำหรับ Agent หุ่นยนต์ที่มีความสามารถใหม่ๆ เช่น การอ่านเครื่องมือ การให้เหตุผลเชิงพื้นที่และทางกายภาพที่ดียิ่งขึ้น

โมเดลก่อนหน้า

การปิดตัวลงของ Gemini 2.0 Flash

โมเดลหลักรุ่นที่ 2 ของเราที่มีฟีเจอร์ยุคใหม่และความสามารถที่ดียิ่งขึ้น ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือแบบเนทีฟ และหน้าต่างบริบทขนาด 1 ล้านโทเค็น

การปิดตัวลงของ Gemini 2.0 Flash-Lite

โมเดลรุ่นที่ 2 ที่เร็วที่สุดของเรา ซึ่งปรับให้เหมาะกับประสิทธิภาพด้านต้นทุนและเวลาในการตอบสนองต่ำ

การปิดตัวลงของ Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง)

โมเดลหลายรูปแบบที่คุ้มค่าที่สุดของเรา ซึ่งมีประสิทธิภาพเร็วที่สุดสำหรับงานที่มีความถี่สูงและมีขนาดเล็ก

การปิดตัวลงของ Gemini 3 Pro (เวอร์ชันตัวอย่าง)

โมเดลการให้เหตุผลที่ล้ำสมัยของเราพร้อมความเข้าใจข้อมูลหลายรูปแบบขั้นสูง

รูปแบบชื่อเวอร์ชันของโมเดล

โมเดล Gemini มีให้ใช้งานในเวอร์ชัน เสถียร ตัวอย่าง ล่าสุด หรือ ทดลอง

เสถียร

ชี้ไปยังโมเดลเสถียรที่เฉพาะเจาะจง โดยปกติแล้วโมเดลเสถียรจะไม่เปลี่ยนแปลง แอปการใช้งานจริงส่วนใหญ่ควรใช้โมเดลเสถียรที่เฉพาะเจาะจง

ตัวอย่างเช่น gemini-3.5-flash

ตัวอย่าง

ชี้ไปยังโมเดลตัวอย่างที่อาจใช้สำหรับการใช้งานจริง โดยปกติแล้วโมเดลตัวอย่างจะเปิดใช้การเรียกเก็บเงิน อาจมีขีดจำกัดอัตราที่เข้มงวดมากขึ้น และจะเลิกใช้งานโดยแจ้งให้ทราบล่วงหน้าอย่างน้อย 2 สัปดาห์

ตัวอย่างเช่น gemini-2.5-flash-preview-09-2025

ล่าสุด

ชี้ไปยังรุ่นล่าสุดสำหรับโมเดลรูปแบบที่เฉพาะเจาะจง ซึ่งอาจเป็นรุ่นเสถียร รุ่นตัวอย่าง หรือรุ่นทดลอง นามแฝงนี้จะมีการสลับแบบร้อนเมื่อมีการเผยแพร่โมเดลรูปแบบที่เฉพาะเจาะจงรุ่นใหม่ เราจะแจ้งให้ทราบทางอีเมลล่วงหน้า 2 สัปดาห์ ก่อนที่จะมีการเปลี่ยนแปลงเวอร์ชันที่อยู่เบื้องหลังเวอร์ชันล่าสุด

ตัวอย่างเช่น gemini-flash-latest

ทดลอง

ชี้ไปยังโมเดลทดลองซึ่งโดยปกติแล้วจะไม่เหมาะกับการใช้งานจริงและมีขีดจำกัดอัตราที่เข้มงวดมากขึ้น เราเผยแพร่โมเดลทดลองเพื่อรวบรวมความคิดเห็นและให้นักพัฒนาซอฟต์แวร์ได้ใช้ข้อมูลอัปเดตล่าสุดของเราอย่างรวดเร็ว

โมเดลทดลองไม่เสถียรและความพร้อมใช้งานของปลายทางโมเดลอาจมีการเปลี่ยนแปลง

การเลิกใช้งานโมเดล

ดูข้อมูลเกี่ยวกับการเลิกใช้งานโมเดลได้ที่หน้าการเลิกใช้งาน Gemini