Interactions API hiện đã được phát hành rộng rãi. Bạn nên sử dụng API này để truy cập vào tất cả các tính năng và mô hình mới nhất.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Mô hình

Hướng dẫn này giới thiệu tất cả các mô hình có sẵn thông qua Gemini API.

Gemini 3

Ổn định

Gemini 3.5 Flash

Mô hình thông minh nhất để duy trì hiệu suất tiên tiến trong các tác vụ tác nhân và lập trình.

Ổn định

Gemini 3.1 Flash-Lite

Hiệu suất ở cấp độ tiên tiến, ngang bằng với các mô hình lớn hơn nhưng chỉ tốn một phần chi phí.

Ổn định

Nano Banana 2

Tạo và chỉnh sửa hình ảnh hiệu quả cao, mạnh mẽ, được tối ưu hoá cho tốc độ và các trường hợp sử dụng với số lượng lớn.

Ổn định

Nano Banana 2 Lite

Độ trễ thấp nhất và khả năng tạo cũng như chỉnh sửa hình ảnh tiết kiệm chi phí, được thiết kế cho các trường hợp sử dụng có tính tương tác cao với số lượng lớn.

Ổn định

Nano Banana Pro

Mô hình tạo và chỉnh sửa hình ảnh tiên tiến để tạo hình ảnh gốc có tính ngữ cảnh cao.

Ổn định

Xem trước

Gemini 3.1 Pro

Trí tuệ tiên tiến, kỹ năng giải quyết vấn đề phức tạp và khả năng mã hoá mạnh mẽ về tác nhân và cảm xúc.

Xem trước

Gemini 3 Flash

Hiệu suất ở cấp độ tiên tiến, ngang bằng với các mô hình lớn hơn nhưng chỉ tốn một phần chi phí.

Xem trước

Gemini 3.5 Live Translate

Mô hình dịch lời nói sang lời nói theo thời gian thực có độ trễ thấp, hỗ trợ hơn 70 ngôn ngữ.

Mới Xem trước

Gemini 3.1 Flash Live

Mô hình Live API chất lượng cao, độ trễ thấp cho các ứng dụng AI tương tác bằng giọng nói và lời thoại theo thời gian thực.

Mới Xem trước

Gemini 3.1 Flash TTS

Tạo lời nói mạnh mẽ với độ trễ thấp.

Mới Xem trước

Gemini Omni Flash

Tạo và chỉnh sửa video nhanh chóng bằng ngôn ngữ tự nhiên. Biến văn bản và hình ảnh thành video, đồng thời tinh chỉnh kết quả bằng ngôn ngữ tự nhiên.

Mới Xem trước

Gemini 2.5 Flash

Mô hình có hiệu suất tốt nhất của chúng tôi cho các tác vụ có độ trễ thấp, khối lượng lớn và yêu cầu khả năng suy luận.

Nano Banana

Tính năng tạo và chỉnh sửa ảnh gốc tiên tiến được thiết kế để mang đến quy trình làm việc sáng tạo và nhanh chóng.

Bản xem trước Gemini 2.5 Flash Live

Được tối ưu hoá cho các tác nhân đàm thoại theo thời gian thực với tính năng phát trực tiếp âm thanh gốc dưới một giây.

Bản xem trước tính năng TTS của Gemini 2.5 Flash

Khả năng tạo âm thanh từ văn bản sang lời nói có thể kiểm soát với khả năng kiểm soát chi tiết về phong cách và tốc độ.

Gemini 2.5 Flash-Lite

Mô hình đa phương thức nhanh nhất và tiết kiệm chi phí nhất trong dòng 2.5.

Gemini 2.5 Pro

Mô hình tiên tiến nhất của chúng tôi dành cho các nhiệm vụ phức tạp, có khả năng suy luận sâu sắc và lập trình.

Bản xem trước TTS của Gemini 2.5 Pro

Tính năng tổng hợp lời nói có độ trung thực cao, được tối ưu hoá để mang lại chất lượng cao trong các quy trình có cấu trúc như podcast và sách nói.

Mẫu âm thanh

Phần này chứa tất cả các mô hình âm thanh, kể cả những mô hình có thể đã được liệt kê trong các phần khác

Bản xem trước Gemini 3.1 Flash Live

Mô hình âm thanh sang âm thanh (A2A) chất lượng cao, độ trễ thấp được thiết kế cho các ứng dụng AI dựa trên giọng nói và hộp thoại theo thời gian thực.

Gemini 3.1 Flash TTS Bản dùng thử

Tạo lời nói mạnh mẽ với độ trễ thấp, đầu ra tự nhiên, câu lệnh có thể điều hướng và thẻ âm thanh biểu cảm mới để kiểm soát chính xác lời tường thuật.

Bản xem trước Gemini 2.5 Flash Live

Mô hình Live API hàng đầu của chúng tôi dành cho các tác nhân thoại và video hai chiều có độ trễ thấp, với khả năng suy luận âm thanh gốc.

Bản xem trước tính năng TTS của Gemini 2.5 Flash

Tính năng chuyển văn bản sang lời nói nhanh chóng và có thể kiểm soát cho các ứng dụng có độ trễ thấp, tiết kiệm chi phí và trợ lý theo thời gian thực.

Bản xem trước TTS của Gemini 2.5 Pro

Tính năng tổng hợp lời nói có độ trung thực cao, được tối ưu hoá để mang lại chất lượng cao trong các quy trình có cấu trúc như podcast và sách nói.

Mô hình nội dung đa phương tiện tạo sinh

Phần này chứa tất cả các mô hình đa phương tiện tạo sinh, kể cả những mô hình có thể đã được liệt kê trong các phần khác

Nano Banana 2

Tạo hình ảnh ở quy mô sản xuất với hiệu suất cao, kết hợp trí tuệ của dòng Gemini 3 với tốc độ tạo siêu nhanh.

Nano Banana 2 Lite

Được thiết kế để trở thành chuyên gia hiệu quả trong nhóm mô hình tạo hình ảnh, cung cấp khả năng tạo và chỉnh sửa hình ảnh với độ trễ cực thấp và tiết kiệm chi phí.

Veo 3.1 Bản xem trước

Tạo video điện ảnh tiên tiến với các chế độ kiểm soát sáng tạo nâng cao và âm thanh được đồng bộ hoá tự nhiên.

Nano Banana Pro

Một công cụ thiết kế chuyên nghiệp với cốt lõi suy luận cho hình ảnh 4K chất lượng phòng thu, bố cục phức tạp và khả năng hiển thị văn bản chính xác.

Veo 3.1 Lite Xem trước

Tạo, chỉnh sửa video và kiểm soát chất lượng điện ảnh với hiệu suất cao, chi phí thấp, ưu tiên nhà phát triển từ dòng sản phẩm Veo 3.1.

Gemini Omni Flash (Bản dùng thử)

Tạo và chỉnh sửa video nhanh chóng bằng ngôn ngữ tự nhiên. Biến văn bản và hình ảnh thành video, đồng thời tinh chỉnh kết quả bằng ngôn ngữ tự nhiên.

Nano Banana

Tính năng tạo và chỉnh sửa ảnh gốc tiên tiến được thiết kế để mang đến quy trình làm việc sáng tạo và nhanh chóng.

Imagen 4 Không dùng nữa

Mô hình chuyển văn bản thành hình ảnh, có khả năng tạo hình ảnh nhanh và siêu nhanh, cũng như độ rõ nét vượt trội lên đến độ phân giải 2K.

Mô hình tạo nhạc

Phần này chứa tất cả các mô hình tạo nhạc, kể cả những mô hình có thể đã được liệt kê trong các phần khác

Lyria 3 Pro (Bản dùng thử)

Mô hình tạo nhạc hàng đầu của chúng tôi, được tối ưu hoá cho các bài hát trọn vẹn có cấu trúc phức tạp và mạch lạc.

Lyria 3 Clip Preview

Được tối ưu hoá để tạo các đoạn nhạc ngắn, vòng lặp và bản xem trước có thời lượng tối đa 30 giây.

Lyria RealTime (Thử nghiệm)

Mô hình tạo nhạc có độ chân thực cao, cung cấp khả năng kiểm soát sáng tạo chi tiết và khả năng phát trực tuyến theo thời gian thực.

Mô hình công cụ và mô hình tác nhân

Sử dụng máy tính Xem trước

Một mô hình chuyên biệt có thể "nhìn thấy" màn hình kỹ thuật số và thực hiện các thao tác trên giao diện người dùng như nhấp, nhập và điều hướng để tự động hoá các tác vụ phức tạp trên trình duyệt.

Bản xem trước của Gemini Deep Research

Một mô hình tác nhân tự động lập kế hoạch và thực hiện nghiên cứu nhiều bước trên hàng trăm nguồn để tạo ra các báo cáo có trích dẫn và mang tính tương tác.

Gemini Deep Research Max (Bản dùng thử)

Tính toàn diện tối đa cho việc thu thập và tổng hợp bối cảnh tự động trên hàng trăm nguồn.

Nhân viên hỗ trợ Antigravity Xem trước

Một tác nhân được quản lý đa năng, có khả năng tự động lập kế hoạch, suy luận, chạy mã, quản lý tệp và duyệt web trong một hộp cát Linux biệt lập, an toàn.

Mô hình tác vụ chuyên biệt

Gemini Embedding 2

Mô hình nhúng đa phương thức đầu tiên của chúng tôi, ánh xạ văn bản, hình ảnh, video, âm thanh và tệp PDF vào một không gian nhúng hợp nhất cho các hệ thống tìm kiếm ngữ nghĩa và RAG nâng cao.

Gemini Embedding

Biểu diễn vectơ có nhiều chiều để tìm kiếm ngữ nghĩa nâng cao, phân loại văn bản và hệ thống RAG.

Gemini Robotics-ER 1.6Bản dùng thử

Mô hình suy luận nâng cao có khả năng hiểu được không gian vật lý và lập kế hoạch cho các tác vụ nhiều bước đối với các tác nhân robot, đồng thời có các chức năng mới như đọc thiết bị, cải thiện khả năng suy luận về không gian và vật lý.

Các mô hình trước

Gemini 2.0 Flash Tắt

Mô hình nền tảng thế hệ thứ hai của chúng tôi, có các tính năng thế hệ mới và khả năng được cải thiện, bao gồm tốc độ vượt trội, khả năng sử dụng công cụ gốc và cửa sổ ngữ cảnh 1 triệu token.

Gemini 2.0 Flash-Lite Tắt

Mô hình thế hệ thứ hai nhanh nhất của chúng tôi, được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.

Bản dùng thử Gemini 3.1 Flash-Lite Tắt

Mô hình đa phương thức tiết kiệm chi phí nhất của chúng tôi, mang lại hiệu suất nhanh nhất cho các tác vụ tần suất cao, dung lượng nhẹ.

Bản dùng thử Gemini 3 Pro Tắt

Mô hình suy luận tiên tiến của chúng tôi, có khả năng hiểu đa phương thức nâng cao.

Các mẫu tên phiên bản mô hình

Các mô hình Gemini có ở phiên bản ổn định, xem trước, mới nhất hoặc thử nghiệm.

Ổn định

Trỏ đến một mô hình ổn định cụ thể. Các mô hình ổn định thường không thay đổi. Hầu hết các ứng dụng phát hành công khai đều nên sử dụng một mô hình ổn định cụ thể.

Ví dụ: gemini-3.5-flash.

Xem trước

Chỉ đến một mô hình xem trước có thể được dùng cho quá trình sản xuất. Các mô hình xem trước thường sẽ được bật tính năng thanh toán, có thể đi kèm với giới hạn tốc độ hạn chế hơn và sẽ ngừng hoạt động sau ít nhất 2 tuần kể từ khi có thông báo.

Ví dụ: gemini-2.5-flash-preview-09-2025.

Mới nhất

Chỉ đến bản phát hành mới nhất của một biến thể mô hình cụ thể. Đây có thể là bản phát hành ổn định, bản phát hành xem trước hoặc bản phát hành thử nghiệm. Bí danh này sẽ được thay thế bằng mọi bản phát hành mới của một biến thể mô hình cụ thể. Chúng tôi sẽ gửi thông báo trước 2 tuần qua email trước khi thay đổi phiên bản cũ nhất.

Ví dụ: gemini-flash-latest.

Thử nghiệm

Chỉ đến một mô hình thử nghiệm thường không phù hợp để sử dụng trong quá trình sản xuất và có giới hạn về tốc độ hạn chế hơn. Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi và nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển.

Các mô hình thử nghiệm không ổn định và khả năng cung cấp các điểm cuối mô hình có thể thay đổi.

Ngừng sử dụng mô hình

Để biết thông tin về các mô hình không dùng nữa, hãy truy cập vào trang Các mô hình Gemini không dùng nữa.