Mô hình định giá
Định giá để giúp bạn đưa ứng dụng của mình ra thế giới
Gemini 1.5 Flash Hiện có
Mô hình đa phương thức nhanh nhất của chúng tôi với hiệu suất tuyệt vời cho các công việc đa dạng, lặp lại và cửa sổ 1 triệu ngữ cảnh. Hiện đã được cung cấp rộng rãi để sử dụng trong sản xuất.
Miễn phí *
"Cấp miễn phí" của Gemini API được cung cấp thông qua dịch vụ API có giới hạn số lượng yêu cầu thấp hơn cho mục đích thử nghiệm. Việc sử dụng Google AI Studio hoàn toàn miễn phí tại tất cả quốc gia được hỗ trợ.
Giới hạn số lần yêu cầu **
15 RPM (yêu cầu mỗi phút)
1 triệu TPM (mã thông báo mỗi phút)
1.500 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Miễn phí, tối đa 1 triệu token mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD) ***
An tâm mở rộng dịch vụ AI nhờ dịch vụ thanh toán trả tiền theo mức dùng của Gemini API. Dễ dàng thiết lập tính năng thanh toán trong Google AI Studio bằng cách nhấp vào "Lấy khoá API".
Giới hạn số lượng yêu cầu **
2.000 vòng/phút (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Lời nhắc có tối đa 128.000 mã thông báo
Nhập giá
0,075 USD / 1 triệu mã thông báo
Giá đầu ra
0,30 USD/1 triệu mã thông báo
Lưu vào bộ nhớ đệm theo ngữ cảnh
0,01875 USD/1 triệu mã thông báo
Lời nhắc dài hơn 128 nghìn
Nhập giá
0,15 USD/1 triệu mã thông báo
Định giá đầu ra
0,60 đô la / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,0375 USD/1 triệu mã thông báo
Lưu vào bộ nhớ đệm theo ngữ cảnh (bộ nhớ)
1 USD/1 triệu mã thông báo mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Dùng để cải thiện các sản phẩm của chúng tôi
Gemini 1.5 Flash-8B Kỳ thanh toán bắt đầu từ ngày 14 tháng 10
Mô hình nhỏ nhất của chúng tôi dành cho các trường hợp sử dụng trí tuệ nhân tạo thấp hơn với cửa sổ ngữ cảnh 1 triệu token. Hiện đã được cung cấp rộng rãi để sử dụng trong sản xuất.
Miễn phí *
"Cấp miễn phí" của Gemini API được cung cấp thông qua dịch vụ API có giới hạn số lượng yêu cầu thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ **
15 RPM (yêu cầu mỗi phút)
1 triệu TPM (mã thông báo mỗi phút)
1.500 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Miễn phí, tối đa 1 triệu token mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD) ***
An tâm mở rộng dịch vụ AI nhờ dịch vụ thanh toán trả tiền theo mức dùng của Gemini API. Dễ dàng thiết lập tính năng thanh toán trong Google AI Studio bằng cách nhấp vào "Lấy khoá API".
Giới hạn số lượng yêu cầu **
4.000 vòng/phút (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Lời nhắc có tối đa 128.000 mã thông báo
Nhập giá
0,0375 USD/1 triệu mã thông báo
Giá đầu ra
0,15 đô la / 1 triệu mã thông báo
Lưu vào bộ nhớ đệm theo ngữ cảnh
0,01 USD/1 triệu mã thông báo
Lời nhắc dài hơn 128 nghìn
Nhập giá
0,075 USD / 1 triệu mã thông báo
Giá đầu ra
0,30 USD/1 triệu mã thông báo
Lưu vào bộ nhớ đệm theo ngữ cảnh
0,02 USD/1 triệu mã thông báo
Lưu vào bộ nhớ đệm theo ngữ cảnh (bộ nhớ)
0,25 USD / 1 triệu token mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Dùng để cải thiện các sản phẩm của chúng tôi
Gemini 1.5 Pro Đã ra mắt
Mô hình thế hệ mới của chúng tôi với cửa sổ ngữ cảnh đột phá 2 triệu token. Hiện đã được cung cấp rộng rãi để sử dụng trong sản xuất.
Miễn phí *
"Cấp miễn phí" của API Gemini được cung cấp thông qua dịch vụ API với giới hạn tốc độ thấp hơn cho mục đích thử nghiệm. Việc sử dụng Google AI Studio hoàn toàn miễn phí tại tất cả quốc gia được hỗ trợ.
Giới hạn tốc độ **
2 RPM (yêu cầu mỗi phút)
32.000 TPM (mã thông báo mỗi phút)
50 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá điều chỉnh
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD) ***
Hãy tự tin mở rộng quy mô dịch vụ AI bằng cách sử dụng dịch vụ thanh toán theo mức dùng của Gemini API. Dễ dàng thiết lập thông tin thanh toán trong Google AI Studio bằng cách nhấp vào "Nhận khoá API".
Giới hạn số lần yêu cầu **
1.000 RPM (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Lời nhắc có tối đa 128.000 mã thông báo
Nhập giá
1,25 USD/1 triệu mã thông báo
Định giá đầu ra
5 USD/1 triệu mã thông báo
Lưu vào bộ nhớ đệm theo ngữ cảnh
0,3125 đô la Mỹ/1 triệu mã thông báo
Lời nhắc dài hơn 128 nghìn
Nhập giá
2,5 USD/1 triệu mã thông báo
Giá đầu ra
10 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,625 USD / 1 triệu token
Lưu vào bộ nhớ đệm theo ngữ cảnh (bộ nhớ)
4,5 USD / 1 triệu token mỗi giờ
Giá điều chỉnh
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Gemini 1.0 Pro Đang hoạt động
Mô hình thế hệ đầu tiên của chúng tôi chỉ cung cấp khả năng suy luận về văn bản và hình ảnh. Có thể sử dụng rộng rãi để phát hành công khai.
Miễn phí *
"Cấp miễn phí" của Gemini API được cung cấp thông qua dịch vụ API có giới hạn số lượng yêu cầu thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ **
15 RPM (yêu cầu mỗi phút)
32.000 TPM (mã thông báo mỗi phút)
1.500 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá điều chỉnh
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD) ***
Hãy tự tin mở rộng quy mô dịch vụ AI bằng cách sử dụng dịch vụ thanh toán theo mức dùng của Gemini API. Dễ dàng thiết lập thông tin thanh toán trong Google AI Studio bằng cách nhấp vào "Nhận khoá API".
Giới hạn số lần yêu cầu **
360 vòng/phút (yêu cầu mỗi phút)
120.000 TPM (mã thông báo mỗi phút)
30.000 yêu cầu mỗi ngày
Nhập giá
0,5 đô la / 1 triệu mã thông báo
Định giá đầu ra
1,5 USD / 1 triệu token
Lưu ngữ cảnh vào bộ nhớ đệm
Không có
Giá điều chỉnh
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Nhúng văn bản 004 Đã có
Mô hình nhúng văn bản tiên tiến của chúng tôi.
Miễn phí *
"Cấp miễn phí" của Gemini API được cung cấp thông qua dịch vụ API có giới hạn số lượng yêu cầu thấp hơn cho mục đích thử nghiệm. Việc sử dụng Google AI Studio hoàn toàn miễn phí tại tất cả quốc gia được hỗ trợ.
Giới hạn số lần yêu cầu**
1.500 vòng/phút (yêu cầu mỗi phút)
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá điều chỉnh
Không áp dụng
Dùng để cải thiện sản phẩm của chúng tôi