Mô hình Gemini

Biến thể mô hình

Gemini API cung cấp nhiều mô hình được tối ưu hoá cho các trường hợp sử dụng cụ thể. Dưới đây là thông tin tổng quan ngắn gọn về các biến thể Gemini hiện có:

Biến thể mô hình (Các) giá trị đầu vào Đầu ra Được tối ưu hoá cho
Gemini 2.0 Flash
gemini-2.0-flash-exp
Âm thanh, hình ảnh, video và văn bản Văn bản, hình ảnh (sắp ra mắt) và âm thanh (sắp ra mắt) Các tính năng, tốc độ và phương thức tạo đa phương thức thế hệ mới cho nhiều loại tác vụ
Gemini 1.5 Flash
gemini-1.5-flash
Âm thanh, hình ảnh, video và văn bản Văn bản Hiệu suất nhanh và linh hoạt trên nhiều tác vụ
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Âm thanh, hình ảnh, video và văn bản Văn bản Số lượng lớn và các tác vụ có mức độ thông minh thấp hơn
Gemini 1.5 Pro
gemini-1.5-pro
Âm thanh, hình ảnh, video và văn bản Văn bản Các nhiệm vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn
(Ngừng hoạt động kể từ ngày 15/2/2025) Gemini 1.0 Pro
gemini-1.0-pro
Văn bản Văn bản Các nhiệm vụ bằng ngôn ngữ tự nhiên, trò chuyện bằng văn bản và mã nhiều lượt, cũng như tạo mã
Nhúng văn bản
text-embedding-004
Văn bản Nhúng văn bản Đo lường mức độ liên quan của các chuỗi văn bản
AQA
aqa
Văn bản Văn bản Cung cấp câu trả lời dựa trên nguồn cho các câu hỏi

(Thử nghiệm) Gemini 2.0 Flash

Gemini 2.0 Flash cung cấp các tính năng thế hệ mới và khả năng cải tiến, bao gồm tốc độ vượt trội, sử dụng công cụ gốc, tạo đa phương thức và cửa sổ ngữ cảnh 1 triệu mã thông báo. Tìm hiểu thêm về Gemini 2.0 Flash trong trang tổng quan của chúng tôi.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã mô hình models/gemini-2.0-flash-exp
Loại dữ liệu được hỗ trợ

Thiết bị vào

Âm thanh, hình ảnh, video và văn bản

Kết quả

Âm thanh (sắp ra mắt), hình ảnh (sắp ra mắt) và văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Giới hạn tốc độ[**]
  • 10 vòng/phút
  • 4 triệu TPM
  • 1.500 dinar Serbia
Khả năng của

Kết quả có cấu trúc

Được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Tìm kiếm

Được hỗ trợ

Tạo hình ảnh

Được hỗ trợ

Sử dụng công cụ gốc

Được hỗ trợ

Tạo âm thanh

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-2.0-flash-exp
Bản cập nhật mới nhất Tháng 12 năm 2024

Gemini 1.5 Flash

Gemini 1.5 Flash là một mô hình đa phương thức nhanh chóng và linh hoạt để mở rộng quy mô trên nhiều tác vụ.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã mô hình models/gemini-1.5-flash
Loại dữ liệu được hỗ trợ

Thiết bị vào

Âm thanh, hình ảnh, video và văn bản

Kết quả

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Quy cách âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

3.600

Thời lượng video tối đa

1 giờ

Thời lượng âm thanh tối đa

Khoảng 9,5 giờ

Giới hạn tốc độ[**]
Miễn phí:
  • 15 vòng/phút
  • 1 triệu TPM
  • 1.500 dinar Serbia
Pay-as-you-go:
  • 2.000 vòng/phút
  • 4 triệu TPM
Khả năng của

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Được hỗ trợ

Lệnh gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Truyền trực tuyến hai chiều

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-1.5-flash-latest
  • Phiên bản ổn định mới nhất: gemini-1.5-flash
  • Ổn định:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Bản cập nhật mới nhất Tháng 9 năm 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B là một mô hình nhỏ được thiết kế cho các tác vụ có độ thông minh thấp hơn.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã mô hình models/gemini-1.5-flash-8b
Loại dữ liệu được hỗ trợ

Thiết bị vào

Âm thanh, hình ảnh, video và văn bản

Kết quả

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

8.192

Quy cách âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

3.600

Thời lượng video tối đa

1 giờ

Thời lượng âm thanh tối đa

Khoảng 9,5 giờ

Giới hạn tốc độ[**]
Miễn phí:
  • 15 vòng/phút
  • 1 triệu TPM
  • 1.500 dinar Serbia
Pay-as-you-go:
  • 4.000 vòng/phút
  • 4 triệu TPM
Khả năng của

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Được hỗ trợ

Lệnh gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Truyền trực tuyến hai chiều

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-1.5-flash-8b-latest
  • Phiên bản ổn định mới nhất: gemini-1.5-flash-8b
  • Ổn định:
    • gemini-1.5-flash-8b-001
Bản cập nhật mới nhất Tháng 10 năm 2024

Gemini 1.5 Pro

Gemini 1.5 Pro là một mô hình đa phương thức cỡ trung được tối ưu hoá cho nhiều loại nhiệm vụ suy luận. 1.5 Pro có thể xử lý một lượng lớn dữ liệu cùng một lúc, bao gồm 2 giờ video, 19 giờ âm thanh, cơ sở mã có 60.000 dòng mã hoặc 2.000 trang văn bản.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã mô hình models/gemini-1.5-pro
Loại dữ liệu được hỗ trợ

Thiết bị vào

Âm thanh, hình ảnh, video và văn bản

Kết quả

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.097.152

Giới hạn mã thông báo đầu ra

8.192

Quy cách âm thanh/hình ảnh

Số lượng hình ảnh tối đa cho mỗi câu lệnh

7.200

Thời lượng video tối đa

2 giờ

Thời lượng âm thanh tối đa

Khoảng 19 giờ

Giới hạn tốc độ[**]
Miễn phí:
  • 2 vòng/phút
  • 32.000 TPM
  • 50 đô la Papua New Guinea
Pay-as-you-go:
  • 1.000 vòng/phút
  • 4 triệu TPM
Khả năng của

Hướng dẫn về hệ thống

Được hỗ trợ

Chế độ JSON

Được hỗ trợ

Giản đồ JSON

Được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Điều chỉnh

Không được hỗ trợ

Gọi hàm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Truyền trực tuyến hai chiều

Không được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Mới nhất: gemini-1.5-pro-latest
  • Phiên bản ổn định mới nhất: gemini-1.5-pro
  • Ổn định:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Bản cập nhật mới nhất Tháng 9 năm 2024

(Không dùng nữa) Gemini 1.0 Pro

Gemini 1.0 Pro là một mô hình NLP xử lý các nhiệm vụ như trò chuyện bằng văn bản và mã nhiều lượt, cũng như tạo mã.

Dùng thử trong Google AI Studio

Chi tiết mô hình

Thuộc tính Mô tả
Mã mô hình models/gemini-1.0-pro
Loại dữ liệu được hỗ trợ

Input

Văn bản

Kết quả

Văn bản

Giới hạn tốc độ[**]
Miễn phí:
  • 15 vòng/phút
  • 32.000 TPM
  • 1.500 dinar Serbia
Pay-as-you-go:
  • 360 vòng/phút
  • 120.000 TPM
  • 30.000 dinar Papua New Guinea
Khả năng của

Hướng dẫn về hệ thống

Không được hỗ trợ

Chế độ JSON

Không được hỗ trợ

Giản đồ JSON

Không được hỗ trợ

Chế độ cài đặt an toàn có thể điều chỉnh

Được hỗ trợ

Lưu vào bộ nhớ đệm

Không được hỗ trợ

Điều chỉnh

Được hỗ trợ

Lệnh gọi hàm

Được hỗ trợ

Cấu hình gọi hàm

Không được hỗ trợ

Thực thi mã

Không được hỗ trợ

Truyền trực tuyến hai chiều

Không được hỗ trợ

Phiên bản
  • Mới nhất: gemini-1.0-pro-latest
  • Phiên bản ổn định mới nhất: gemini-1.0-pro
  • Ổn định: gemini-1.0-pro-001
Bản cập nhật mới nhất Tháng 2 năm 2024

Nhúng văn bản và nhúng

Nhúng văn bản

Nội dung nhúng văn bản được dùng để đo lường mức độ liên quan của các chuỗi và được sử dụng rộng rãi trong nhiều ứng dụng AI.

text-embedding-004 đạt được hiệu suất truy xuất mạnh mẽ hơn và vượt trội so với các mô hình hiện có với các phương diện tương đương, dựa trên điểm chuẩn nhúng MTEB tiêu chuẩn.

Chi tiết mô hình
Thuộc tính Mô tả
Mã mô hình

Gemini API

models/text-embedding-004

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Kết quả

Nhúng văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.048

Kích thước phương diện đầu ra

768

Giới hạn tốc độ[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Không được hỗ trợ
Bản cập nhật mới nhất Tháng 4 năm 2024

Nhúng

Bạn có thể sử dụng mô hình Nhúng để tạo nội dung nhúng văn bản cho văn bản đầu vào.

Mô hình nhúng được tối ưu hoá để tạo các mục nhúng có 768 phương diện cho văn bản có tối đa 2.048 mã thông báo.

Nhúng thông tin chi tiết về mô hình
Thuộc tính Mô tả
Mã mô hình models/embedding-001
Loại dữ liệu được hỗ trợ

Input

Văn bản

Kết quả

Nhúng văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

2.048

Kích thước phương diện đầu ra

768

Giới hạn tốc độ[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Không được hỗ trợ
Bản cập nhật mới nhất Tháng 12 năm 2023

AQA

Bạn có thể sử dụng mô hình AQA để thực hiện các nhiệm vụ liên quan đến tính năng Trả lời câu hỏi được phân bổ (AQA) trên một tài liệu, tập hợp văn bản hoặc một tập hợp các đoạn văn bản. Mô hình AQA trả về câu trả lời cho các câu hỏi dựa trên các nguồn được cung cấp, cùng với việc ước tính xác suất có thể trả lời.

Chi tiết mô hình

Thuộc tính Mô tả
Mã mô hình models/aqa
Loại dữ liệu được hỗ trợ

Input

Văn bản

Kết quả

Văn bản

Ngôn ngữ được hỗ trợ Tiếng Anh
Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

7.168

Giới hạn mã thông báo đầu ra

1.024

Giới hạn tốc độ[**] 1.500 yêu cầu mỗi phút
Chế độ cài đặt an toàn có thể điều chỉnh Được hỗ trợ
Bản cập nhật mới nhất Tháng 12 năm 2023

Hãy xem các ví dụ để khám phá khả năng của các biến thể mô hình này.

[*] Một mã thông báo tương đương với khoảng 4 ký tự đối với các mô hình Gemini. 100 mã thông báo tương đương với khoảng 60 đến 80 từ tiếng Anh.

[**] RPM: Số yêu cầu mỗi phút
TPM: Số mã thông báo mỗi phút
RPD: Số yêu cầu mỗi ngày
TPD: Số mã thông báo mỗi ngày

Do hạn chế về dung lượng, chúng tôi không đảm bảo các giới hạn tốc độ tối đa đã chỉ định.

Mẫu tên phiên bản mô hình

Các mô hình Gemini có sẵn ở phiên bản xem trước hoặc ổn định. Trong mã, bạn có thể sử dụng một trong các định dạng tên mô hình sau để chỉ định mô hình và phiên bản mà bạn muốn sử dụng.

  • Mới nhất: Trỏ đến phiên bản mới nhất của mô hình cho một thế hệ và biến thể cụ thể. Mô hình cơ bản được cập nhật thường xuyên và có thể là phiên bản xem trước. Chỉ các ứng dụng kiểm thử thăm dò và nguyên mẫu mới nên sử dụng bí danh này.

    Để chỉ định phiên bản mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-latest. Ví dụ: gemini-1.0-pro-latest.

  • Phiên bản ổn định mới nhất: Chỉ đến phiên bản ổn định mới nhất được phát hành cho phiên bản và biến thể mô hình đã chỉ định.

    Để chỉ định phiên bản ổn định mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>. Ví dụ: gemini-1.0-pro.

  • Ổn định: Chỉ đến một mô hình ổn định cụ thể. Các mô hình ổn định không thay đổi. Hầu hết các ứng dụng phát hành công khai đều nên sử dụng một mô hình ổn định cụ thể.

    Để chỉ định một phiên bản ổn định, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-1.0-pro-001.

  • Thử nghiệm: Trỏ đến một mô hình thử nghiệm có trong Bản xem trước, như được xác định trong Điều khoản, nghĩa là mô hình này không dùng cho mục đích phát hành chính thức. Chúng tôi phát hành các mô hình thử nghiệm để thu thập ý kiến phản hồi, nhanh chóng cung cấp các bản cập nhật mới nhất cho nhà phát triển và nêu bật tốc độ đổi mới đang diễn ra tại Google. Những gì chúng tôi rút ra được từ các bản phát hành thử nghiệm sẽ giúp chúng tôi biết cách phát hành các mô hình rộng rãi hơn. Bạn có thể hoán đổi một mô hình thử nghiệm cho một mô hình khác mà không cần thông báo trước. Chúng tôi không đảm bảo rằng mô hình thử nghiệm sẽ trở thành mô hình ổn định trong tương lai.

    Để chỉ định một phiên bản thử nghiệm, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-exp-1121.

Ngôn ngữ được hỗ trợ

Các mô hình Gemini được huấn luyện để hoạt động với các ngôn ngữ sau:

  • Tiếng Ả Rập (ar)
  • Tiếng Bengal (bn)
  • Tiếng Bulgaria (bg)
  • Tiếng Trung giản thể và phồn thể (zh)
  • Tiếng Croatia (hr)
  • Tiếng Séc (cs)
  • Tiếng Đan Mạch (da)
  • Tiếng Hà Lan (nl)
  • Tiếng Anh (en)
  • Tiếng Estonia (et)
  • Tiếng Phần Lan (fi)
  • Tiếng Pháp (fr)
  • Tiếng Đức (de)
  • Tiếng Hy Lạp (el)
  • Tiếng Do Thái (iw)
  • Tiếng Hindi (hi)
  • Tiếng Hungary (hu)
  • Tiếng Indonesia (id)
  • Tiếng Ý (it)
  • Tiếng Nhật (ja)
  • Tiếng Hàn (ko)
  • Tiếng Latvia (lv)
  • Tiếng Lithuania (lt)
  • Tiếng Na Uy (no)
  • Tiếng Ba Lan (pl)
  • Tiếng Bồ Đào Nha (pt)
  • Tiếng Romania (ro)
  • Tiếng Nga (ru)
  • Tiếng Serbia (sr)
  • Tiếng Slovak (sk)
  • Tiếng Slovenia (sl)
  • Tiếng Tây Ban Nha (es)
  • Tiếng Swahili (sw)
  • Tiếng Thuỵ Điển (sv)
  • Tiếng Thái (th)
  • Tiếng Thổ Nhĩ Kỳ (tr)
  • Tiếng Ukraina (uk)
  • Tiếng Việt (vi)