Định giá để giúp bạn đưa ứng dụng của mình ra thế giới
Hiện còn phòng
Hiện còn phòng
Hiện còn phòng
Mô hình đa phương thức nhanh nhất của chúng tôi với hiệu suất tuyệt vời cho các công việc đa dạng, lặp lại và cửa sổ 1 triệu ngữ cảnh. Hiện đã có thể sử dụng rộng rãi để phát hành công khai.
Miễn phí*
Giới hạn số lần yêu cầu**
15 RPM (yêu cầu mỗi phút)
1 triệu TPM (mã thông báo mỗi phút)
1.500 RPD (yêu cầu mỗi ngày)
Giá (mục nhập)
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá (đầu ra)
Miễn phí
Câu lệnh/câu trả lời dùng để cải thiện sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)***
Giới hạn số lần yêu cầu**
1000 vòng/phút (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
Giá (mục nhập)
0,35 USD / 1 triệu token (cho lời nhắc lên đến 128.000 token)
0,7 USD / 1 triệu token (cho lời nhắc dài hơn 128 nghìn)
Lưu ngữ cảnh vào bộ nhớ đệm
0,0875 USD / 1 triệu token (cho lời nhắc lên đến 128.000 token)
0,175 USD / 1 triệu token (cho lời nhắc dài hơn 128 nghìn)
1 USD / 1 triệu token mỗi giờ (lưu trữ)
Giá (đầu ra)
1,05 đô la / 1 triệu token (cho lời nhắc lên đến 128.000 token)
2,1 đô la / 1 triệu token (cho lời nhắc dài hơn 128.000)
Câu lệnh/câu trả lời dùng để cải thiện sản phẩm của chúng tôi
Không
Mô hình thế hệ tiếp theo của chúng tôi với cửa sổ ngữ cảnh 2 triệu mang tính đột phá. Hiện đã có thể sử dụng rộng rãi để phát hành công khai.
Miễn phí*
Giới hạn số lần yêu cầu**
2 RPM (yêu cầu mỗi phút)
32.000 TPM (mã thông báo mỗi phút)
50 RPD (yêu cầu mỗi ngày)
Giá (mục nhập)
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá (đầu ra)
Miễn phí
Câu lệnh/câu trả lời dùng để cải thiện sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)***
Giới hạn số lần yêu cầu**
360 vòng/phút (yêu cầu mỗi phút)
4 triệu TPM (mã thông báo mỗi phút)
10.000 RPD (yêu cầu mỗi ngày)
Giá (mục nhập)
3,5 đô la / 1 triệu token (cho lời nhắc lên đến 128.000 token)
7 USD / 1 triệu token (cho lời nhắc dài hơn 128.000 token)
Lưu ngữ cảnh vào bộ nhớ đệm
0,875 USD / 1 triệu token (cho lời nhắc lên đến 128.000 token)
1,75 đô la / 1 triệu token (cho lời nhắc dài hơn 128 nghìn)
4,5 USD / 1 triệu token mỗi giờ (lưu trữ)
Giá (đầu ra)
10,50 đô la / 1 triệu token (cho lời nhắc lên đến 128.000 token)
21 USD / 1 triệu token (cho lời nhắc dài hơn 128.000 token)
Câu lệnh/câu trả lời dùng để cải thiện sản phẩm của chúng tôi
Không
Mô hình thế hệ đầu tiên của chúng tôi chỉ cung cấp chức năng suy luận văn bản và hình ảnh. Có thể sử dụng rộng rãi để phát hành công khai.
Miễn phí*
Giới hạn số lần yêu cầu**
15 RPM (yêu cầu mỗi phút)
32.000 TPM (mã thông báo mỗi phút)
1.500 RPD (yêu cầu mỗi ngày)
Giá (mục nhập)
Miễn phí
Lưu ngữ cảnh vào bộ nhớ đệm
Không áp dụng
Giá (đầu ra)
Miễn phí
Câu lệnh/câu trả lời dùng để cải thiện sản phẩm của chúng tôi
Trả tiền theo mức dùng (giá tính theo USD)***
Giới hạn số lần yêu cầu**
360 vòng/phút (yêu cầu mỗi phút)
120.000 TPM (mã thông báo mỗi phút)
30.000 RPD (yêu cầu mỗi ngày)
Giá (mục nhập)
0,5 USD / 1 triệu token
Lưu ngữ cảnh vào bộ nhớ đệm
Không có
Giá (đầu ra)
1,5 đô la / 1 triệu mã thông báo
Câu lệnh/câu trả lời dùng để cải thiện sản phẩm của chúng tôi
Không
*Các quy định hạn chế về việc sử dụng bậc miễn phí của Gemini API áp dụng cho Khu vực kinh tế Châu Âu (EEA), Vương quốc Anh và Thuỵ Sĩ. Xem Câu hỏi thường gặp về việc thanh toán để biết thông tin chi tiết.
**Giới hạn tốc độ đã chỉ định không được đảm bảo và dung lượng thực tế có thể thay đổi. Đăng ký tăng giới hạn mức giá tối đa (chỉ dành cho bậc có tính phí).
***Chi phí suy luận của mô hình điều chỉnh được lập hoá đơn ở cùng mức giá với các mô hình cơ sở. Để được trợ giúp về việc thanh toán, hãy xem Hỗ trợ thanh toán trên Cloud.
****Giá có thể khác với giá niêm yết tại đây và giá cung cấp trên Vertex AI. Để biết giá của Vertex, hãy xem tài liệu về Vertex.
Xây dựng bằng Vertex AI trên Google Cloud