Bản xem trước trực tiếp Gemini 2.5 Flash

Live API cho phép tương tác bằng giọng nói và video theo thời gian thực với độ trễ thấp với Gemini 2.5 Flash. Nó xử lý luồng âm thanh, video hoặc văn bản liên tục để đưa ra phản hồi bằng giọng nói ngay lập tức và giống như con người, tạo ra trải nghiệm trò chuyện tự nhiên cho người dùng.

Tài liệu

Hãy truy cập vào hướng dẫn về Live API để xem toàn bộ các tính năng và chức năng.

gemini-2.5-flash-native-audio-preview-12-2025

Thuộc tính Mô tả
Mã kiểu máy gemini-2.5-flash-native-audio-preview-12-2025
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Âm thanh, video, văn bản

Đầu ra

Âm thanh và văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

131.072

Giới hạn mã thông báo đầu ra

8.192

Chức năng

Tạo âm thanh

Được hỗ trợ

Batch API

Không được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Tìm kiếm tệp

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Kết nối với Google Maps

Không được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Live API

Được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Đầu ra có cấu trúc

Không được hỗ trợ

Tư duy

Được hỗ trợ

Bối cảnh URL

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-2.5-flash-native-audio-preview-12-2025
  • Xem trước: gemini-2.5-flash-native-audio-preview-09-2025
Thông tin cập nhật mới nhất Tháng 9 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025