ตอนนี้ Interactions API พร้อมให้บริการแก่ผู้ใช้ทั่วไปแล้ว เราขอแนะนำให้ใช้ API นี้เพื่อเข้าถึงฟีเจอร์และโมเดลล่าสุดทั้งหมด

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

โมเดล

Gemini 3

เสถียร

Gemini 3.5 Flash

โมเดลที่ชาญฉลาดที่สุดสำหรับประสิทธิภาพการทำงานที่ล้ำสมัยอย่างต่อเนื่องในงานแบบ Agent และงานเขียนโค้ด

เสถียร

Gemini 3.1 Flash-Lite

ประสิทธิภาพระดับล้ำสมัยเทียบเท่าโมเดลขนาดใหญ่กว่าในราคาที่ถูกกว่ามาก

เสถียร

Nano Banana 2

การสร้างและแก้ไขรูปภาพที่มีประสิทธิภาพสูงและมีประสิทธิภาพสูง ซึ่งปรับให้เหมาะกับกรณีการใช้งานที่รวดเร็วและมีปริมาณมาก

เสถียร

Nano Banana 2 Lite

การสร้างและแก้ไขรูปภาพที่มีเวลาในการตอบสนองต่ำมากและคุ้มค่า ซึ่งออกแบบมาสำหรับกรณีการใช้งานแบบโต้ตอบที่มีปริมาณมาก

เสถียร

Nano Banana Pro

โมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัยที่สุดสำหรับการสร้างรูปภาพแบบเนทีฟที่มีบริบทสูง

เสถียร

Preview

Gemini 3.1 Pro

ความสามารถในการให้เหตุผลขั้นสูง ทักษะการแก้ปัญหาที่ซับซ้อน และความสามารถในการเขียนโค้ดแบบ Agent และแบบ Vibe ที่ทรงพลัง

Preview

Gemini 3 Flash

Preview

Gemini 3.5 Live Translate

โมเดลการแปลเสียงพูดเป็นเสียงพูดแบบเรียลไทม์ที่มีเวลาในการตอบสนองต่ำ ซึ่งรองรับมากกว่า 70 ภาษา

New Preview

Gemini 3.1 Flash Live

โมเดล Live API คุณภาพสูงที่มีเวลาในการตอบสนองต่ำสำหรับการสนทนาแบบเรียลไทม์และแอปพลิเคชัน AI ที่ใช้เสียงเป็นหลัก

New Preview

Gemini 3.1 Flash TTS

การสร้างเสียงพูดที่มีประสิทธิภาพและมีเวลาในการตอบสนองต่ำ

New Preview

Gemini Omni Flash

การสร้างและแก้ไขวิดีโอแบบสนทนาที่รวดเร็ว เปลี่ยนข้อความและรูปภาพให้เป็นวิดีโอ และปรับแต่งผลลัพธ์ผ่านภาษาธรรมชาติ

New Preview

Gemini 2.5 Flash

โมเดลที่มีประสิทธิภาพคุ้มค่าที่สุดของเราสำหรับงานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้การให้เหตุผล

Nano Banana

การสร้างและแก้ไขรูปภาพแบบเนทีฟที่ล้ำสมัยที่สุดซึ่งออกแบบมาสำหรับเวิร์กโฟลว์ที่รวดเร็วและสร้างสรรค์

Gemini 2.5 Flash Live Preview

ปรับให้เหมาะกับ Agent แบบสนทนาแบบเรียลไทม์ที่มีการสตรีมเสียงแบบเนทีฟที่ใช้เวลาน้อยกว่า 1 วินาที

Gemini 2.5 Flash TTS Preview

การสร้างเสียงพูดจากข้อความที่ควบคุมได้พร้อมการควบคุมสไตล์และจังหวะอย่างละเอียด

Gemini 2.5 Flash-Lite

โมเดลหลายรูปแบบที่เร็วที่สุดและคุ้มค่าที่สุดในตระกูล 2.5

Gemini 2.5 Pro

โมเดลขั้นสูงที่สุดของเราสำหรับงานที่ซับซ้อน ซึ่งมีความสามารถในการให้เหตุผลและการเขียนโค้ดที่ลึกซึ้ง

Gemini 2.5 Pro TTS Preview

การสังเคราะห์เสียงพูดแบบรายละเอียดเสมือนจริงสูงซึ่งปรับให้เหมาะกับคุณภาพในเวิร์กโฟลว์ที่มีโครงสร้าง เช่น พ็อดแคสต์และหนังสือเสียง

โมเดลเสียง

ส่วนนี้มีโมเดลเสียงทั้งหมด รวมถึงโมเดลที่อาจแสดงอยู่ในส่วนอื่นๆ แล้ว

Gemini 3.1 Flash Live Preview

โมเดลเสียงพูดเป็นเสียงพูด (A2A) คุณภาพสูงที่มีเวลาในการตอบสนองต่ำ ซึ่งออกแบบมาสำหรับการสนทนาแบบเรียลไทม์และแอปพลิเคชัน AI ที่ใช้เสียงเป็นหลัก

Gemini 3.1 Flash TTS Preview

การสร้างเสียงพูดที่มีประสิทธิภาพและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแสดงอารมณ์ใหม่สำหรับการควบคุมการบรรยายที่แม่นยำ

Gemini 2.5 Flash Live Preview

โมเดล Live API หลักของเราสำหรับ Agent เสียงและวิดีโอแบบ 2 ทิศทางที่มีเวลาในการตอบสนองต่ำพร้อมความสามารถในการให้เหตุผลด้านเสียงแบบเนทีฟ

Gemini 2.5 Flash TTS Preview

การสร้างเสียงพูดจากข้อความที่รวดเร็วและควบคุมได้สำหรับแอปพลิเคชันที่มีเวลาในการตอบสนองต่ำและคุ้มค่า รวมถึงผู้ช่วยแบบเรียลไทม์

โมเดลสื่อที่สร้างขึ้น

ส่วนนี้มีโมเดลสื่อที่สร้างขึ้นทั้งหมด รวมถึงโมเดลที่อาจแสดงอยู่ในส่วนอื่นๆ แล้ว

Nano Banana 2

การสร้างภาพขนาดใหญ่ที่มีประสิทธิภาพสูง ซึ่งผสานรวมความสามารถในการให้เหตุผลของตระกูล Gemini 3 เข้ากับความเร็วในการสร้างที่รวดเร็ว

Nano Banana 2 Lite

ออกแบบมาให้เป็นผู้เชี่ยวชาญด้านประสิทธิภาพของตระกูลการสร้างรูปภาพ โดยมีการสร้างและแก้ไขรูปภาพที่มีเวลาในการตอบสนองต่ำมากและคุ้มค่า

Veo 3.1 Preview

การสร้างวิดีโอสไตล์ภาพยนตร์ที่ล้ำสมัยที่สุดพร้อมการควบคุมความคิดสร้างสรรค์ขั้นสูงและเสียงที่ซิงค์แบบเนทีฟ

Nano Banana Pro

เอนจินการออกแบบระดับมืออาชีพที่มีแกนกลางในการให้เหตุผลสำหรับภาพระดับสตูดิโอ 4K, เลย์เอาต์ที่ซับซ้อน และการแสดงข้อความที่แม่นยำ

Veo 3.1 Lite Preview

การสร้างและแก้ไขวิดีโอที่มีประสิทธิภาพสูง ต้นทุนต่ำ และเน้นนักพัฒนาซอฟต์แวร์เป็นหลัก รวมถึงการควบคุมสไตล์ภาพยนตร์จากตระกูล Veo 3.1

Imagen 4 (เลิกใช้งานแล้ว)

โมเดลการสร้างรูปภาพจากข้อความที่ล้ำสมัยที่สุดของเรา ซึ่งมีการสร้างที่รวดเร็วและรวดเร็วมาก รวมถึงความคมชัดที่ยอดเยี่ยมสูงสุดถึงความละเอียด 2K

โมเดลการสร้างเพลง

ส่วนนี้มีโมเดลการสร้างเพลงทั้งหมด รวมถึงโมเดลที่อาจแสดงอยู่ในส่วนอื่นๆ แล้ว

Lyria 3 Pro Preview

โมเดลการสร้างเพลงหลักของเรา ซึ่งปรับให้เหมาะกับเพลงเต็มเพลงที่มีความสอดคล้องของโครงสร้างที่ซับซ้อน

Lyria 3 Clip Preview

ปรับให้เหมาะกับการสร้างคลิปเพลงสั้นๆ ลูป และตัวอย่างความยาวสูงสุด 30 วินาที

Lyria RealTime (เวอร์ชันทดลอง)

โมเดลการสร้างเพลงแบบรายละเอียดเสมือนจริงสูงซึ่งมีการควบคุมความคิดสร้างสรรค์แบบละเอียดและความสามารถในการสตรีมแบบเรียลไทม์

โมเดลเครื่องมือและโมเดล Agent

Computer Use Preview

โมเดลเฉพาะที่ "มองเห็น" หน้าจอดิจิทัลและดำเนินการ UI ได้ เช่น การคลิก การพิมพ์ และการไปยังส่วนต่างๆ เพื่อทำให้งานเบราว์เซอร์ที่ซับซ้อนเป็นไปโดยอัตโนมัติ

Gemini Deep Research Preview

โมเดลแบบ Agent ที่วางแผนและดำเนินการวิจัยแบบหลายขั้นตอนจากแหล่งข้อมูลหลายร้อยแห่งโดยอัตโนมัติเพื่อสร้างรายงานแบบโต้ตอบที่มีการอ้างอิง

Gemini Deep Research Max Preview

ความครอบคลุมสูงสุดสำหรับการรวบรวมและสังเคราะห์บริบทโดยอัตโนมัติจากแหล่งข้อมูลหลายร้อยแห่ง

Antigravity Agent Preview

Agent ที่มีการจัดการแบบอเนกประสงค์ซึ่งวางแผน ให้เหตุผล เรียกใช้โค้ด จัดการไฟล์ และท่องเว็บภายในแซนด์บ็อกซ์ Linux ที่ปลอดภัยและแยกจากกันโดยอัตโนมัติ

โมเดลงานเฉพาะ

Gemini Embedding 2

โมเดลการฝังหลายรูปแบบแรกของเรา ซึ่งแมปข้อความ รูปภาพ วิดีโอ เสียง และ PDF ลงในพื้นที่การฝังแบบรวมสำหรับการค้นหาเชิงความหมายขั้นสูงและระบบ RAG

Gemini Embedding

การแสดงเวกเตอร์แบบหลายมิติสำหรับการค้นหาเชิงความหมายขั้นสูง การจัดประเภทข้อความ และระบบ RAG

Gemini Robotics-ER 1.6Preview

โมเดลการให้เหตุผลขั้นสูงที่เข้าใจพื้นที่ทางกายภาพและวางแผนงานแบบหลายขั้นตอนสำหรับ Agent หุ่นยนต์ที่มีความสามารถใหม่ๆ เช่น การอ่านเครื่องมือ การให้เหตุผลเชิงพื้นที่และทางกายภาพที่ดียิ่งขึ้น

โมเดลก่อนหน้า

การปิดตัวลงของ Gemini 2.0 Flash

โมเดลหลักรุ่นที่ 2 ของเราที่มีฟีเจอร์รุ่นใหม่และความสามารถที่ดียิ่งขึ้น ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือแบบเนทีฟ และหน้าต่างบริบทขนาด 1 ล้านโทเค็น

การปิดตัวลงของ Gemini 2.0 Flash-Lite

โมเดลรุ่นที่ 2 ที่เร็วที่สุดของเรา ซึ่งปรับให้เหมาะกับประสิทธิภาพด้านต้นทุนและเวลาในการตอบสนองต่ำ

การปิดตัวลงของ Gemini 3.1 Flash-Lite Preview

โมเดลหลายรูปแบบที่คุ้มค่าที่สุดของเรา ซึ่งมีประสิทธิภาพเร็วที่สุดสำหรับงานที่มีความถี่สูงและมีขนาดเล็ก

การปิดตัวลงของ Gemini 3 Pro Preview

โมเดลการให้เหตุผลที่ล้ำสมัยที่สุดของเราพร้อมความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบขั้นสูง

รูปแบบชื่อเวอร์ชันของโมเดล

โมเดล Gemini มีให้ใช้งานในเวอร์ชัน เสถียร ตัวอย่าง ล่าสุด หรือ ทดลอง

เสถียร

ชี้ไปยังโมเดลเสถียรที่เฉพาะเจาะจง โดยปกติแล้วโมเดลเสถียรจะไม่เปลี่ยนแปลง แอปการใช้งานจริงส่วนใหญ่ควรใช้โมเดลเสถียรที่เฉพาะเจาะจง

ตัวอย่างเช่น gemini-3.5-flash

Preview

ชี้ไปยังโมเดลตัวอย่างที่อาจใช้สำหรับการใช้งานจริง โดยปกติแล้วโมเดลตัวอย่างจะมีการเรียกเก็บเงิน อาจมีขีดจำกัดอัตราที่เข้มงวดมากขึ้น และจะเลิกใช้งานโดยแจ้งให้ทราบล่วงหน้าอย่างน้อย 2 สัปดาห์

ตัวอย่างเช่น gemini-2.5-flash-preview-09-2025

ล่าสุด

ชี้ไปยังรุ่นล่าสุดสำหรับโมเดลรูปแบบที่เฉพาะเจาะจง ซึ่งอาจเป็นรุ่นเสถียร รุ่นตัวอย่าง หรือรุ่นทดลอง นามแฝงนี้จะมีการสลับแบบร้อนเมื่อมีการเผยแพร่โมเดลรูปแบบที่เฉพาะเจาะจงรุ่นใหม่ เราจะแจ้งให้ทราบทางอีเมลล่วงหน้า 2 สัปดาห์ ก่อนที่จะมีการเปลี่ยนแปลงเวอร์ชันที่อยู่เบื้องหลังเวอร์ชันล่าสุด

ตัวอย่างเช่น gemini-flash-latest

ทดลอง

ชี้ไปยังโมเดลทดลองซึ่งโดยปกติแล้วจะไม่เหมาะกับการใช้งานจริงและมีขีดจำกัดอัตราที่เข้มงวดมากขึ้น เราเผยแพร่โมเดลทดลองเพื่อรวบรวมความคิดเห็นและให้นักพัฒนาซอฟต์แวร์ได้ใช้ข้อมูลอัปเดตล่าสุดของเราอย่างรวดเร็ว

โมเดลทดลองไม่เสถียรและความพร้อมใช้งานของปลายทางโมเดลอาจมีการเปลี่ยนแปลง

การเลิกใช้งานโมเดล

ดูข้อมูลเกี่ยวกับการเลิกใช้งานโมเดลได้ที่หน้าการเลิกใช้งาน Gemini