2.0 Flash
Mô hình đa phương thức mới nhất của chúng tôi, với các tính năng thế hệ mới và khả năng cải thiện
- Nhập âm thanh, hình ảnh, video và văn bản — nhận phản hồi bằng văn bản, hình ảnh và âm thanh
- Cung cấp các hoạt động tương tác trò chuyện có độ trễ thấp thông qua API Trực tiếp đa phương thức
Biến thể mô hình
Gemini API cung cấp nhiều mô hình được tối ưu hoá cho các trường hợp sử dụng cụ thể. Dưới đây là thông tin tổng quan ngắn gọn về các biến thể Gemini hiện có:
Biến thể mô hình | (Các) giá trị đầu vào | Đầu ra | Được tối ưu hoá cho |
---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash-exp |
Âm thanh, hình ảnh, video và văn bản | Văn bản, hình ảnh (sắp ra mắt) và âm thanh (sắp ra mắt) | Các tính năng, tốc độ và phương thức tạo đa phương thức thế hệ mới cho nhiều loại tác vụ |
Gemini 1.5 Flash
gemini-1.5-flash |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Hiệu suất nhanh và linh hoạt trên nhiều tác vụ |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Số lượng lớn và các tác vụ có mức độ thông minh thấp hơn |
Gemini 1.5 Pro
gemini-1.5-pro |
Âm thanh, hình ảnh, video và văn bản | Văn bản | Các nhiệm vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn |
(Ngừng hoạt động kể từ ngày 15/2/2025) Gemini 1.0 Pro
gemini-1.0-pro |
Văn bản | Văn bản | Các nhiệm vụ bằng ngôn ngữ tự nhiên, trò chuyện bằng văn bản và mã nhiều lượt, cũng như tạo mã |
Nhúng văn bản
text-embedding-004 |
Văn bản | Nhúng văn bản | Đo lường mức độ liên quan của các chuỗi văn bản |
AQA
aqa |
Văn bản | Văn bản | Cung cấp câu trả lời dựa trên nguồn cho các câu hỏi |
(Thử nghiệm) Gemini 2.0 Flash
Gemini 2.0 Flash cung cấp các tính năng thế hệ mới và khả năng cải tiến, bao gồm tốc độ vượt trội, sử dụng công cụ gốc, tạo đa phương thức và cửa sổ ngữ cảnh 1 triệu mã thông báo. Tìm hiểu thêm về Gemini 2.0 Flash trong trang tổng quan của chúng tôi.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình | models/gemini-2.0-flash-exp |
Loại dữ liệu được hỗ trợ |
Thiết bị vào Âm thanh, hình ảnh, video và văn bản Kết quả Âm thanh (sắp ra mắt), hình ảnh (sắp ra mắt) và văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
[**] | Giới hạn tốc độ
|
Khả năng của |
Kết quả có cấu trúc Được hỗ trợ Lưu vào bộ nhớ đệm Không được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Tìm kiếm Được hỗ trợ Tạo hình ảnh Được hỗ trợ Sử dụng công cụ gốc Được hỗ trợ Tạo âm thanh Được hỗ trợ |
Phiên bản |
|
Bản cập nhật mới nhất | Tháng 12 năm 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash là một mô hình đa phương thức nhanh chóng và linh hoạt để mở rộng quy mô trên nhiều tác vụ.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình | models/gemini-1.5-flash |
Loại dữ liệu được hỗ trợ |
Thiết bị vào Âm thanh, hình ảnh, video và văn bản Kết quả Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Quy cách âm thanh/hình ảnh |
Số lượng hình ảnh tối đa cho mỗi câu lệnh 3.600 Thời lượng video tối đa 1 giờ Thời lượng âm thanh tối đa Khoảng 9,5 giờ |
[**] | Giới hạn tốc độ
|
Khả năng của |
Hướng dẫn về hệ thống Được hỗ trợ Chế độ JSON Được hỗ trợ Giản đồ JSON Được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Được hỗ trợ Lệnh gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Truyền trực tuyến hai chiều Không được hỗ trợ |
Phiên bản |
|
Bản cập nhật mới nhất | Tháng 9 năm 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B là một mô hình nhỏ được thiết kế cho các tác vụ có độ thông minh thấp hơn.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình | models/gemini-1.5-flash-8b |
Loại dữ liệu được hỗ trợ |
Thiết bị vào Âm thanh, hình ảnh, video và văn bản Kết quả Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 8.192 |
Quy cách âm thanh/hình ảnh |
Số lượng hình ảnh tối đa cho mỗi câu lệnh 3.600 Thời lượng video tối đa 1 giờ Thời lượng âm thanh tối đa Khoảng 9,5 giờ |
[**] | Giới hạn tốc độ
|
Khả năng của |
Hướng dẫn về hệ thống Được hỗ trợ Chế độ JSON Được hỗ trợ Giản đồ JSON Được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Được hỗ trợ Lệnh gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Truyền trực tuyến hai chiều Không được hỗ trợ |
Phiên bản |
|
Bản cập nhật mới nhất | Tháng 10 năm 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro là một mô hình đa phương thức cỡ trung được tối ưu hoá cho nhiều loại nhiệm vụ suy luận. 1.5 Pro có thể xử lý một lượng lớn dữ liệu cùng một lúc, bao gồm 2 giờ video, 19 giờ âm thanh, cơ sở mã có 60.000 dòng mã hoặc 2.000 trang văn bản.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình | models/gemini-1.5-pro |
Loại dữ liệu được hỗ trợ |
Thiết bị vào Âm thanh, hình ảnh, video và văn bản Kết quả Văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 2.097.152 Giới hạn mã thông báo đầu ra 8.192 |
Quy cách âm thanh/hình ảnh |
Số lượng hình ảnh tối đa cho mỗi câu lệnh 7.200 Thời lượng video tối đa 2 giờ Thời lượng âm thanh tối đa Khoảng 19 giờ |
[**] | Giới hạn tốc độ
|
Khả năng của |
Hướng dẫn về hệ thống Được hỗ trợ Chế độ JSON Được hỗ trợ Giản đồ JSON Được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Điều chỉnh Không được hỗ trợ Gọi hàm Được hỗ trợ Thực thi mã Được hỗ trợ Truyền trực tuyến hai chiều Không được hỗ trợ |
Phiên bản |
|
Bản cập nhật mới nhất | Tháng 9 năm 2024 |
(Không dùng nữa) Gemini 1.0 Pro
Gemini 1.0 Pro là một mô hình NLP xử lý các nhiệm vụ như trò chuyện bằng văn bản và mã nhiều lượt, cũng như tạo mã.
Dùng thử trong Google AI Studio
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình | models/gemini-1.0-pro |
Loại dữ liệu được hỗ trợ |
Input Văn bản Kết quả Văn bản |
[**] | Giới hạn tốc độ
|
Khả năng của |
Hướng dẫn về hệ thống Không được hỗ trợ Chế độ JSON Không được hỗ trợ Giản đồ JSON Không được hỗ trợ Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ Lưu vào bộ nhớ đệm Không được hỗ trợ Điều chỉnh Được hỗ trợ Lệnh gọi hàm Được hỗ trợ Cấu hình gọi hàm Không được hỗ trợ Thực thi mã Không được hỗ trợ Truyền trực tuyến hai chiều Không được hỗ trợ |
Phiên bản |
|
Bản cập nhật mới nhất | Tháng 2 năm 2024 |
Nhúng văn bản và nhúng
Nhúng văn bản
Nội dung nhúng văn bản được dùng để đo lường mức độ liên quan của các chuỗi và được sử dụng rộng rãi trong nhiều ứng dụng AI.
text-embedding-004
đạt được hiệu suất truy xuất mạnh mẽ hơn và vượt trội so với các mô hình hiện có với các phương diện tương đương, dựa trên điểm chuẩn nhúng MTEB tiêu chuẩn.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình |
Gemini API
|
Các loại dữ liệu được hỗ trợ |
Input Văn bản Kết quả Nhúng văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 2.048 Kích thước phương diện đầu ra 768 |
[**] | Giới hạn tốc độ1.500 yêu cầu mỗi phút |
Chế độ cài đặt an toàn có thể điều chỉnh | Không được hỗ trợ |
Bản cập nhật mới nhất | Tháng 4 năm 2024 |
Nhúng
Bạn có thể sử dụng mô hình Nhúng để tạo nội dung nhúng văn bản cho văn bản đầu vào.
Mô hình nhúng được tối ưu hoá để tạo các mục nhúng có 768 phương diện cho văn bản có tối đa 2.048 mã thông báo.
Nhúng thông tin chi tiết về mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình |
models/embedding-001
|
Loại dữ liệu được hỗ trợ |
Input Văn bản Kết quả Nhúng văn bản |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 2.048 Kích thước phương diện đầu ra 768 |
[**] | Giới hạn tốc độ1.500 yêu cầu mỗi phút |
Chế độ cài đặt an toàn có thể điều chỉnh | Không được hỗ trợ |
Bản cập nhật mới nhất | Tháng 12 năm 2023 |
AQA
Bạn có thể sử dụng mô hình AQA để thực hiện các nhiệm vụ liên quan đến tính năng Trả lời câu hỏi được phân bổ (AQA) trên một tài liệu, tập hợp văn bản hoặc một tập hợp các đoạn văn bản. Mô hình AQA trả về câu trả lời cho các câu hỏi dựa trên các nguồn được cung cấp, cùng với việc ước tính xác suất có thể trả lời.
Chi tiết mô hình
Thuộc tính | Mô tả |
---|---|
Mã mô hình | models/aqa |
Loại dữ liệu được hỗ trợ |
Input Văn bản Kết quả Văn bản |
Ngôn ngữ được hỗ trợ | Tiếng Anh |
[*] | Giới hạn mã thông báo
Giới hạn mã thông báo đầu vào 7.168 Giới hạn mã thông báo đầu ra 1.024 |
[**] | Giới hạn tốc độ1.500 yêu cầu mỗi phút |
Chế độ cài đặt an toàn có thể điều chỉnh | Được hỗ trợ |
Bản cập nhật mới nhất | Tháng 12 năm 2023 |
Hãy xem các ví dụ để khám phá khả năng của các biến thể mô hình này.
[*] Một mã thông báo tương đương với khoảng 4 ký tự đối với các mô hình Gemini. 100 mã thông báo tương đương với khoảng 60 đến 80 từ tiếng Anh.
[**] RPM: Số yêu cầu mỗi phút
TPM: Số mã thông báo mỗi phút
RPD: Số yêu cầu mỗi ngày
TPD: Số mã thông báo mỗi ngày
Do hạn chế về dung lượng, chúng tôi không đảm bảo các giới hạn tốc độ tối đa đã chỉ định.
Mẫu tên phiên bản mô hình
Các mô hình Gemini có sẵn ở phiên bản xem trước hoặc ổn định. Trong mã, bạn có thể sử dụng một trong các định dạng tên mô hình sau để chỉ định mô hình và phiên bản mà bạn muốn sử dụng.
Mới nhất: Trỏ đến phiên bản mới nhất của mô hình cho một thế hệ và biến thể cụ thể. Mô hình cơ bản được cập nhật thường xuyên và có thể là phiên bản xem trước. Chỉ các ứng dụng kiểm thử thăm dò và nguyên mẫu mới nên sử dụng bí danh này.
Để chỉ định phiên bản mới nhất, hãy sử dụng mẫu sau:
<model>-<generation>-<variation>-latest
. Ví dụ:gemini-1.0-pro-latest
.Phiên bản ổn định mới nhất: Chỉ đến phiên bản ổn định mới nhất được phát hành cho phiên bản và biến thể mô hình đã chỉ định.
Để chỉ định phiên bản ổn định mới nhất, hãy sử dụng mẫu sau:
<model>-<generation>-<variation>
. Ví dụ:gemini-1.0-pro
.Ổn định: Chỉ đến một mô hình ổn định cụ thể. Các mô hình ổn định không thay đổi. Hầu hết các ứng dụng phát hành công khai đều nên sử dụng một mô hình ổn định cụ thể.
Để chỉ định một phiên bản ổn định, hãy sử dụng mẫu sau:
<model>-<generation>-<variation>-<version>
. Ví dụ:gemini-1.0-pro-001
.Thử nghiệm: Trỏ đến một mô hình thử nghiệm có trong Bản xem trước, như được xác định trong Điều khoản, nghĩa là mô hình này không dùng cho mục đích phát hành chính thức. Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi, nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển và nêu bật tốc độ đổi mới đang diễn ra tại Google. Những gì chúng tôi rút ra được từ các bản phát hành thử nghiệm sẽ giúp chúng tôi biết cách phát hành các mô hình rộng rãi hơn. Bạn có thể hoán đổi một mô hình thử nghiệm cho một mô hình khác mà không cần thông báo trước. Chúng tôi không đảm bảo rằng mô hình thử nghiệm sẽ trở thành mô hình ổn định trong tương lai.
Để chỉ định một phiên bản thử nghiệm, hãy sử dụng mẫu sau:
<model>-<generation>-<variation>-<version>
. Ví dụ:gemini-exp-1121
.
Ngôn ngữ được hỗ trợ
Các mô hình Gemini được huấn luyện để hoạt động với các ngôn ngữ sau:
- Tiếng Ả Rập (
ar
) - Tiếng Bengal (
bn
) - Tiếng Bulgaria (
bg
) - Tiếng Trung giản thể và phồn thể (
zh
) - Tiếng Croatia (
hr
) - Tiếng Séc (
cs
) - Tiếng Đan Mạch (
da
) - Tiếng Hà Lan (
nl
) - Tiếng Anh (
en
) - Tiếng Estonia (
et
) - Tiếng Phần Lan (
fi
) - Tiếng Pháp (
fr
) - Tiếng Đức (
de
) - Tiếng Hy Lạp (
el
) - Tiếng Do Thái (
iw
) - Tiếng Hindi (
hi
) - Tiếng Hungary (
hu
) - Tiếng Indonesia (
id
) - Tiếng Ý (
it
) - Tiếng Nhật (
ja
) - Tiếng Hàn (
ko
) - Tiếng Latvia (
lv
) - Tiếng Lithuania (
lt
) - Tiếng Na Uy (
no
) - Tiếng Ba Lan (
pl
) - Tiếng Bồ Đào Nha (
pt
) - Tiếng Romania (
ro
) - Tiếng Nga (
ru
) - Tiếng Serbia (
sr
) - Tiếng Slovak (
sk
) - Tiếng Slovenia (
sl
) - Tiếng Tây Ban Nha (
es
) - Tiếng Swahili (
sw
) - Tiếng Thuỵ Điển (
sv
) - Tiếng Thái (
th
) - Tiếng Thổ Nhĩ Kỳ (
tr
) - Tiếng Ukraina (
uk
) - Tiếng Việt (
vi
)