Gemini

Biến thể mô hình

Gemini API cung cấp nhiều mô hình được tối ưu hoá cho những mục đích sử dụng cụ thể trường hợp. Dưới đây là thông tin tổng quan ngắn gọn về các biến thể hiện có của Gemini:

Biến thể của mô hình (Các) dữ liệu đầu vào Đầu ra Được tối ưu hoá cho
Gemini 1.5 Pro gemini-1.5-pro
Âm thanh, hình ảnh, video và văn bản Văn bản Các nhiệm vụ suy luận phức tạp như viết mã và tạo văn bản, chỉnh sửa văn bản, giải quyết vấn đề, trích xuất và tạo dữ liệu
Gemini 1.5 Flash gemini-1.5-flash
Âm thanh, hình ảnh, video và văn bản Văn bản Hiệu suất nhanh chóng và linh hoạt trong nhiều tác vụ đa dạng
Gemini 1.0 Pro gemini-1.0-pro
Văn bản Văn bản Nhiệm vụ bằng ngôn ngữ tự nhiên, cuộc trò chuyện về mã và văn bản nhiều lượt và mã thế hệ
(Không dùng nữa) Tầm nhìn Gemini 1.0 Pro gemini-pro-vision
Hình ảnh, video và văn bản Văn bản Các công việc liên quan đến hình ảnh, chẳng hạn như tạo hình ảnh mô tả hoặc vật thể nhận dạng trong hình ảnh
Nhúng văn bản text-embedding-004
Văn bản Nhúng văn bản Đo lường mức độ liên quan của các chuỗi văn bản
AQA (Chỉ số sức khoẻ theo chất lượng không khí) aqa
Văn bản Văn bản Đưa ra câu trả lời dựa trên nguồn thông tin cho các câu hỏi

Bảng sau đây mô tả các thuộc tính của các mô hình Gemini phổ biến với tất cả biến thể mô hình:

Thuộc tính Mô tả
Dữ liệu huấn luyện Hạn chót nhận đơn hàng để nắm bắt thông tin của Gemini là tháng 11 năm 2023. Kiến thức về các sự kiện sau khoảng thời gian đó bị giới hạn.
Ngôn ngữ được hỗ trợ Xem các ngôn ngữ được hỗ trợ
Tham số mô hình có thể định cấu hình
  • P trên cùng
  • K hàng đầu
  • Nhiệt độ
  • Dừng trình tự
  • Độ dài đầu ra tối đa
  • Số lượng câu trả lời đề xuất

Xem thông số mô hình của các mô hình tạo sinh sẽ giúp bạn biết thông tin về từng tham số này.

Gemini 1.5 Flash

Gemini 1.5 Flash là một mô hình đa phương thức nhanh và linh hoạt giúp mở rộng quy mô trên đa dạng nhiệm vụ.

Dùng thử trong AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-1.5-flash
Các loại dữ liệu được hỗ trợ

Thiết bị vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn về mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Thông số kỹ thuật âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

3.600

Thời lượng video tối đa

1 giờ

Thời lượng âm thanh tối đa

Khoảng 9,5 giờ

Giới hạn giá[**]
Miễn phí:
  • 15 vòng/phút
  • 1 triệu TPM
  • 1.500 RPD
Pay-as-you-go:
  • 1.000 vòng/phút
  • 2 triệu TPM (Mô-đun nền tảng đáng tin cậy)

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Không được hỗ trợ

Các chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Cấu hình gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Thông tin mới nhất Tháng 5/2024

Gemini 1.5 Pro

Gemini 1.5 Pro là một mô hình đa phương thức có kích thước trung bình được tối ưu hoá cho đa dạng nhiệm vụ lập luận. 1.5 Pro có thể xử lý một lượng lớn dữ liệu cùng một lúc, bao gồm 2 giờ video, 19 giờ âm thanh, cơ sở mã 60.000 dòng mã hoặc 2.000 trang văn bản.

Dùng thử trong AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-1.5-pro
Các loại dữ liệu được hỗ trợ

Thiết bị vào

Âm thanh, hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn về mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.097.152

Giới hạn mã thông báo đầu ra

8.192

Thông số kỹ thuật âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

7.200

Thời lượng video tối đa

2 giờ

Thời lượng âm thanh tối đa

Khoảng 19 giờ

Giới hạn giá[**]
Miễn phí:
  • 2 vòng/phút
  • 32.000 TPM (Mô-đun nền tảng đáng tin cậy)
  • 50 RPD
Pay-as-you-go:
  • 360 vòng/phút
  • 2 triệu TPM (Mô-đun nền tảng đáng tin cậy)
  • 10.000 RPD

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Các chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Cấu hình gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Thông tin mới nhất Tháng 5/2024

Gemini 1.0 Pro

Gemini 1.0 Pro là một mô hình NLP, giúp xử lý những công việc như nhập văn bản nhiều lượt và trò chuyện mã và tạo mã.

Dùng thử trong AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-1.0-pro
Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Văn bản

Giới hạn giá[**]
Miễn phí:
  • 15 vòng/phút
  • 32.000 TPM (Mô-đun nền tảng đáng tin cậy)
  • 1.500 RPD
Pay-as-you-go:
  • 360 vòng/phút
  • 120.000 TPM
  • 30.000 RPD

Hướng dẫn về hệ thống

Không được hỗ trợ

Chế độ JSON

Không được hỗ trợ

Giản đồ JSON

Không được hỗ trợ

Các chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Chỉnh

Được hỗ trợ

Gọi hàm

Được hỗ trợ

Cấu hình gọi hàm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Thông tin mới nhất Tháng 2 năm 2024

(Không dùng nữa) Tầm nhìn Gemini 1.0 Pro

Gemini 1.0 Pro Vision là một mô hình đa phương thức được tối ưu hoá hiệu suất có thể thực hiện các công việc liên quan đến hình ảnh. Ví dụ: 1.0 Pro Vision có thể tạo nội dung mô tả bằng hình ảnh, xác định các đối tượng có trong hình ảnh, cung cấp thông tin về các địa điểm hoặc đối tượng có trong hình ảnh và nhiều thông tin khác.

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/gemini-pro-vision
Các loại dữ liệu được hỗ trợ

Thiết bị vào

Hình ảnh, video và văn bản

Đầu ra

Văn bản

Giới hạn về mã thông báo[*]

Giới hạn mã thông báo đầu vào

12.288

Giới hạn mã thông báo đầu ra

4.096

Thông số kỹ thuật âm thanh/hình ảnh

Thời lượng video tối đa

2 phút

Giới hạn giá[**] 60 yêu cầu mỗi phút

Hướng dẫn về hệ thống

Không được hỗ trợ

Chế độ JSON

Không được hỗ trợ

Giản đồ JSON

Không được hỗ trợ

Các chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Cấu hình gọi hàm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Thông tin mới nhất Tháng 12 năm 2023

Nhúng và nhúng văn bản

Nhúng văn bản

Bạn có thể sử dụng mô hình Nhúng văn bản để tạo Nhúng văn bản cho văn bản nhập. Để biết thêm thông tin về mô hình Nhúng văn bản, truy cập vào Tài liệu về AI tạo sinh trên Vertex AI về tính năng nhúng văn bản.

Mô hình Nhúng văn bản được tối ưu hoá để tạo các mục nhúng bằng 768 cho văn bản lên đến 2.048 token. Tính năng Nhúng văn bản mang lại khả năng đàn hồi các kích thước nhúng dưới 768. Bạn có thể dùng các thành phần nhúng đàn hồi để tạo kích thước đầu ra nhỏ hơn và có khả năng tiết kiệm chi phí tính toán và lưu trữ làm giảm hiệu suất không đáng kể.

Chi tiết mô hình
Thuộc tính Mô tả
Mã kiểu máy

API Gemini

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Nhúng văn bản

Giới hạn về mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.048

Kích thước phương diện đầu ra

768

Giới hạn giá[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Không được hỗ trợ
Thông tin mới nhất Tháng 4 năm 2024

Nhúng

Bạn có thể sử dụng mô hình Nhúng để tạo Nhúng văn bản cho văn bản nhập.

Mô hình Nhúng được tối ưu hoá để tạo các mục nhúng có 768 chiều cho văn bản lên tới 2.048 mã thông báo.

Chi tiết mô hình nhúng
Thuộc tính Mô tả
Mã kiểu máy models/embedding-001
Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Nhúng văn bản

Giới hạn về mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.048

Kích thước phương diện đầu ra

768

Giới hạn giá[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Không được hỗ trợ
Thông tin mới nhất Tháng 12 năm 2023

AQA (Chỉ số sức khoẻ theo chất lượng không khí)

Bạn có thể sử dụng mô hình AQA để thực hiện Giải đáp câu hỏi được phân bổ (AQA) liên quan đến các công việc liên quan đến một tài liệu, tập sao lục hoặc một tập hợp đoạn văn. AQA (Chỉ số sức khoẻ theo chất lượng không khí) mô hình này sẽ trả về câu trả lời cho các câu hỏi dựa trên các nguồn đã cung cấp, cùng với việc ước tính xác suất trả lời được.

Chi tiết mô hình

Thuộc tính Mô tả
Mã kiểu máy models/aqa
Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Văn bản

Ngôn ngữ được hỗ trợ Tiếng Anh
Giới hạn về mã thông báo[*]

Giới hạn mã thông báo đầu vào

7.168

Giới hạn mã thông báo đầu ra

1.024

Giới hạn giá[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ
Thông tin mới nhất Tháng 12 năm 2023

Hãy xem ví dụ để khám phá khả năng của các mô hình này biến thể.

[*] Một mã thông báo tương đương với khoảng 4 ký tự đối với mô hình Gemini. 100 mã thông báo có khoảng 60-80 từ tiếng Anh.

[**] RPM: Số yêu cầu mỗi phút
TPM: Số mã thông báo mỗi phút
RPD: Số yêu cầu mỗi ngày
TPD: Mã thông báo mỗi ngày

Do giới hạn dung lượng, giới hạn tốc độ tối đa được chỉ định sẽ không được được đảm bảo.

Mẫu tên phiên bản mô hình

Các mô hình Gemini có sẵn ở phiên bản bản xem trước hoặc phiên bản chính thức. Trong bạn có thể sử dụng một trong các định dạng tên mô hình sau để chỉ định mô hình và phiên bản bạn muốn sử dụng.

  • Mới nhất: Trỏ tới phiên bản tiên tiến của mô hình cho một tạo và biến thể. Mô hình cơ bản được cập nhật thường xuyên và có thể là phiên bản xem trước. Chỉ nên sử dụng các ứng dụng và nguyên mẫu thử nghiệm mang tính khám phá sử dụng bí danh này.

    Để chỉ định phiên bản mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-latest. Ví dụ: gemini-1.0-pro-latest.

  • Bản ổn định mới nhất: Trỏ đến phiên bản ổn định mới nhất được phát hành cho việc tạo và biến thể mô hình được chỉ định.

    Để chỉ định phiên bản ổn định mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>. Ví dụ: gemini-1.0-pro.

  • Ổn định: Trỏ tới một mô hình ổn định cụ thể. Mô hình ổn định không thay đổi. Hầu hết ứng dụng chính thức nên sử dụng một mô hình ổn định cụ thể.

    Để chỉ định phiên bản ổn định, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-1.0-pro-001.

Ngôn ngữ hỗ trợ

Các mô hình Gemini được huấn luyện để tương thích với các ngôn ngữ sau:

  • Tiếng Ả Rập (ar)
  • Tiếng Bengali (bn)
  • Tiếng Bulgaria (bg)
  • Tiếng Trung giản thể và phồn thể (zh)
  • Tiếng Croatia (hr)
  • Tiếng Séc (cs)
  • Tiếng Đan Mạch (da)
  • Tiếng Hà Lan (nl)
  • Tiếng Anh (en)
  • Tiếng Estonia (et)
  • Tiếng Phần Lan (fi)
  • Tiếng Pháp (fr)
  • Tiếng Đức (de)
  • Tiếng Hy Lạp (el)
  • Tiếng Do Thái (iw)
  • Tiếng Hindi (hi)
  • Tiếng Hungary (hu)
  • Tiếng Indonesia (id)
  • Tiếng Ý (it)
  • Tiếng Nhật (ja)
  • Tiếng Hàn (ko)
  • Tiếng Latvia (lv)
  • Tiếng Lithuania (lt)
  • Tiếng Na Uy (no)
  • Tiếng Ba Lan (pl)
  • Tiếng Bồ Đào Nha (pt)
  • Tiếng Romania (ro)
  • Tiếng Nga (ru)
  • Tiếng Serbia (sr)
  • Tiếng Slovakia (sk)
  • Tiếng Slovenia (sl)
  • Tiếng Tây Ban Nha (es)
  • Tiếng Swahili (sw)
  • Tiếng Thuỵ Điển (sv)
  • Tiếng Thái (th)
  • Tiếng Thổ Nhĩ Kỳ (tr)
  • Tiếng Ukraina (uk)
  • Tiếng Việt (vi)