Mô hình định giá
Giá cả giúp bạn đưa ứng dụng ra thế giới
Gemini 1.5 Flash Đã ra mắt
Mô hình đa phương thức nhanh nhất của chúng tôi với hiệu suất cao cho các tác vụ đa dạng, lặp lại và cửa sổ ngữ cảnh 1 triệu. Hiện đã được cung cấp rộng rãi để sử dụng trong sản xuất.
Miễn phí
"Cấp miễn phí" của API Gemini được cung cấp thông qua dịch vụ API với giới hạn tốc độ thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ
15 RPM (yêu cầu mỗi phút)
1 triệu TPM (mã thông báo mỗi phút)
1.500 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Miễn phí, tối đa 1 triệu mã thông báo bộ nhớ mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Tìm thông tin cơ bản trên Google Tìm kiếm
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)
Hãy tự tin mở rộng quy mô dịch vụ AI bằng cách sử dụng dịch vụ thanh toán theo mức dùng của Gemini API. Dễ dàng thiết lập tính năng thanh toán trong Google AI Studio bằng cách nhấp vào "Lấy khoá API".
Giới hạn số lượng yêu cầu
2.000 RPM (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Lệnh gọi đến tối đa 128.000 mã thông báo
Nhập giá
0,075 USD / 1 triệu mã thông báo
Định giá đầu ra
0,30 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,01875 USD / 1 triệu mã thông báo
Lời nhắc dài hơn 128k
Nhập giá
0,15 USD / 1 triệu mã thông báo
Định giá đầu ra
0,6 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,0375 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm (bộ nhớ)
1 USD / 1 triệu mã thông báo mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Tìm thông tin cơ bản trên Google Tìm kiếm
35 USD / 1.000 yêu cầu huỷ kích hoạt (tối đa 5.000 yêu cầu mỗi ngày).
Dùng để cải thiện các sản phẩm của chúng tôi
Gemini 1.5 Flash-8B Đã ra mắt
Mô hình nhỏ nhất của chúng tôi dành cho các trường hợp sử dụng có mức độ thông minh thấp hơn với cửa sổ ngữ cảnh 1 triệu mã thông báo. Hiện đã được cung cấp rộng rãi để sử dụng trong sản xuất.
Miễn phí
"Cấp miễn phí" của API Gemini được cung cấp thông qua dịch vụ API với giới hạn tốc độ thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ
15 RPM (yêu cầu mỗi phút)
1 triệu TPM (mã thông báo mỗi phút)
1.500 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Miễn phí, tối đa 1 triệu mã thông báo bộ nhớ mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Tìm thông tin cơ bản trên Google Tìm kiếm
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)
Hãy tự tin mở rộng quy mô dịch vụ AI bằng cách sử dụng dịch vụ thanh toán theo mức dùng của Gemini API. Dễ dàng thiết lập tính năng thanh toán trong Google AI Studio bằng cách nhấp vào "Lấy khoá API".
Giới hạn số lượng yêu cầu
4.000 RPM (số yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Lệnh gọi đến tối đa 128.000 mã thông báo
Nhập giá
0,0375 USD / 1 triệu mã thông báo
Định giá đầu ra
0,15 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,01 USD / 1 triệu mã thông báo
Lời nhắc dài hơn 128k
Nhập giá
0,075 USD / 1 triệu mã thông báo
Định giá đầu ra
0,30 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,02 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm (bộ nhớ)
0,25 USD / 1 triệu mã thông báo mỗi giờ
Giá điều chỉnh
Giá đầu vào/đầu ra giống nhau đối với các mô hình được điều chỉnh. Dịch vụ điều chỉnh là miễn phí.
Tìm thông tin cơ bản trên Google Tìm kiếm
35 USD / 1.000 yêu cầu huỷ kích hoạt (tối đa 5.000 yêu cầu mỗi ngày).
Dùng để cải thiện các sản phẩm của chúng tôi
Gemini 1.5 Pro Đã ra mắt
Mô hình thế hệ mới của chúng tôi với cửa sổ ngữ cảnh đột phá 2 triệu token. Hiện đã được cung cấp rộng rãi để sử dụng trong sản xuất.
Miễn phí
"Cấp miễn phí" của API Gemini được cung cấp thông qua dịch vụ API với giới hạn tốc độ thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ
2 RPM (yêu cầu mỗi phút)
32.000 TPM (mã thông báo mỗi phút)
50 RPD (yêu cầu mỗi ngày)
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá điều chỉnh
Không có
Tìm thông tin cơ bản trên Google Tìm kiếm
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)
Hãy tự tin mở rộng quy mô dịch vụ AI bằng cách sử dụng dịch vụ thanh toán theo mức dùng của Gemini API. Dễ dàng thiết lập tính năng thanh toán trong Google AI Studio bằng cách nhấp vào "Lấy khoá API".
Giới hạn tốc độ
1.000 RPM (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Lệnh gọi đến tối đa 128.000 mã thông báo
Nhập giá
1,25 USD / 1 triệu mã thông báo
Định giá đầu ra
5 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,3125 đô la Mỹ / 1 triệu mã thông báo
Lời nhắc dài hơn 128k
Nhập giá
2,5 USD / 1 triệu mã thông báo
Định giá đầu ra
10 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
0,625 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm (bộ nhớ)
4,5 USD / 1 triệu mã thông báo mỗi giờ
Giá điều chỉnh
Không có
Tìm thông tin cơ bản trên Google Tìm kiếm
35 USD / 1.000 yêu cầu huỷ kích hoạt (tối đa 5.000 yêu cầu mỗi ngày).
Dùng để cải thiện các sản phẩm của chúng tôi
Gemini 1.0 Pro Đang hoạt động
Mô hình thế hệ đầu tiên của chúng tôi chỉ cung cấp khả năng suy luận về văn bản và hình ảnh. Thường được cung cấp để sử dụng trong phiên bản chính thức.
Miễn phí
"Cấp miễn phí" của API Gemini được cung cấp thông qua dịch vụ API có giới hạn tốc độ thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ
15 RPM (yêu cầu mỗi phút)
32.000 TPM (mã thông báo mỗi phút)
1.500 yêu cầu mỗi ngày
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá điều chỉnh
Không có
Tìm thông tin cơ bản trên Google Tìm kiếm
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)
Hãy tự tin mở rộng quy mô dịch vụ AI bằng cách sử dụng dịch vụ thanh toán theo mức dùng của Gemini API. Dễ dàng thiết lập tính năng thanh toán trong Google AI Studio bằng cách nhấp vào "Lấy khoá API".
Giới hạn tốc độ
360 RPM (số yêu cầu mỗi phút)
120.000 TPM (mã thông báo mỗi phút)
30.000 yêu cầu mỗi ngày
Nhập giá
0,5 USD / 1 triệu mã thông báo
Định giá đầu ra
1,5 USD / 1 triệu mã thông báo
Lưu ngữ cảnh vào bộ nhớ đệm
Không có
Giá điều chỉnh
Không có
Tìm thông tin cơ bản trên Google Tìm kiếm
Không có
Dùng để cải thiện các sản phẩm của chúng tôi
Nhúng văn bản 004 Đã có
Mô hình nhúng văn bản hiện đại của chúng tôi.
Miễn phí
"Cấp miễn phí" của API Gemini được cung cấp thông qua dịch vụ API có giới hạn tốc độ thấp hơn cho mục đích thử nghiệm. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả quốc gia có hỗ trợ.
Giới hạn tốc độ
1.500 RPM (số yêu cầu mỗi phút)
Nhập giá
Miễn phí
Định giá đầu ra
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá điều chỉnh
Không áp dụng
Dùng để cải thiện các sản phẩm của chúng tôi