Mô hình Gemini

Gemini là một dòng mô hình AI tạo sinh hỗ trợ nhà phát triển tạo nội dung và giải quyết vấn đề. Các mô hình này được thiết kế và huấn luyện để xử lý cả văn bản và hình ảnh làm dữ liệu đầu vào. Hướng dẫn này cung cấp thông tin về từng biến thể mô hình để giúp bạn quyết định biến thể phù hợp nhất với trường hợp sử dụng của mình.

Dưới đây là phần tóm tắt ngắn gọn về các mô hình hiện có và khả năng của các mô hình đó:

Mô hình Đầu vào Đầu ra
Gemini
  • Gemini 1.5 Pro (Chỉ xem trước)
Văn bản và hình ảnh Văn bản
  • Gemini 1.0 Pro
Văn bản Văn bản
  • Tầm nhìn Gemini 1.0 Pro
Văn bản và hình ảnh Văn bản
Nhúng
  • Nhúng
Văn bản Nhúng văn bản
Truy xuất
  • AQA (Chỉ số chất lượng không khí)
Văn bản Văn bản

Tính an toàn và mục đích sử dụng

Các mô hình trí tuệ nhân tạo tạo sinh là những công cụ mạnh mẽ, nhưng không phải lúc nào cũng có những hạn chế riêng. Tính linh hoạt và khả năng áp dụng đôi khi có thể dẫn đến kết quả ngoài dự kiến, chẳng hạn như kết quả không chính xác, thiên lệch hoặc phản cảm. Quy trình xử lý hậu kỳ và đánh giá thủ công nghiêm ngặt là những yếu tố cần thiết để hạn chế rủi ro thiệt hại do những kết quả đó. Xem hướng dẫn về an toàn để biết thêm các đề xuất về việc sử dụng an toàn.

Các mô hình do API Gemini cung cấp có thể được dùng cho nhiều ứng dụng dựa trên AI tạo sinh và xử lý ngôn ngữ tự nhiên (NLP). Bạn chỉ có thể sử dụng các hàm này thông qua API Gemini hoặc ứng dụng web Google AI Studio. Việc bạn sử dụng API Gemini cũng phải tuân theo Chính sách về các hành vi bị cấm khi sử dụng AI tạo sinhĐiều khoản dịch vụ của API Gemini.

Kích thước mô hình

Bảng sau đây cho thấy các kích thước hiện có và ý nghĩa của các kích thước đó so với nhau.

Kích thước mô hình Nội dung mô tả Dịch vụ
Gemini 1.0 Pro Một kích thước mô hình cân bằng giữa khả năng và tính hiệu quả.
  • văn bản
  • trò chuyện

Phiên bản mô hình

Các mô hình Gemini có phiên bản xem trước hoặc ổn định. Trong mã của mình, bạn có thể sử dụng một trong các định dạng tên mô hình sau đây để chỉ định mô hình và phiên bản mà bạn muốn sử dụng.

  • Mới nhất: Trỏ đến phiên bản tiên tiến của mô hình cho một thế hệ và biến thể cụ thể. Mô hình cơ bản được cập nhật thường xuyên và có thể là phiên bản xem trước. Chỉ các ứng dụng kiểm thử khám phá và nguyên mẫu mới được sử dụng bí danh này.

    Để chỉ định phiên bản mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-latest. Ví dụ: gemini-1.0-pro-latest.

  • Ổn định mới nhất:Trỏ đến phiên bản ổn định gần đây nhất được phát hành cho biến thể và mô hình được chỉ định.

    Để chỉ định phiên bản ổn định mới nhất, hãy sử dụng mẫu sau: <model>-<generation>-<variation>. Ví dụ: gemini-1.0-pro.

  • Ổn định: Trỏ đến một mô hình ổn định cụ thể. Mô hình ổn định sẽ không thay đổi. Hầu hết các ứng dụng chính thức nên sử dụng mô hình ổn định cụ thể.

    Để chỉ định một phiên bản ổn định, hãy sử dụng mẫu sau: <model>-<generation>-<variation>-<version>. Ví dụ: gemini-1.0-pro-001.

Đối với các mô hình có phiên bản ổn định, hãy xem hàng "Tên mô hình" cho mô hình trong phần Biến thể mô hình.

Biến thể mô hình

API Gemini cung cấp nhiều mô hình được tối ưu hoá cho các trường hợp sử dụng cụ thể. Bảng sau đây mô tả các thuộc tính của từng báo cáo.

Nội dung đa dạng Thuộc tính Nội dung mô tả
Gemini 1.5 Pro (Chỉ xem trước) Mô hình được cập nhật lần gần đây nhất Tháng 4 năm 2024
Mã kiểu máy models/gemini-1.5-pro-latest
Chức năng của mô hình
  • Đầu vào: âm thanh, hình ảnh, văn bản
  • Đầu ra: văn bản
  • Được tối ưu hoá cho các nhiệm vụ ngôn ngữ như:
    • Tạo mã
    • Tạo văn bản
    • Chỉnh sửa văn bản
    • Giải quyết vấn đề
    • Tạo đề xuất
    • Trích xuất thông tin
    • Trích xuất hoặc tạo dữ liệu
    • Tác nhân AI
  • Có thể xử lý các tác vụ không cần thiết, một và vài lần.
Các phương thức tạo được hỗ trợ generateContent
Giới hạn mã thông báo đầu vào 1048576
Giới hạn mã thông báo đầu ra 8192
Độ an toàn của mô hình Các chế độ cài đặt an toàn được áp dụng tự động mà nhà phát triển có thể điều chỉnh. Hãy xem chủ đề chế độ cài đặt an toàn để biết thông tin chi tiết.
Giới hạn số lượng yêu cầu 2 truy vấn mỗi phút, 1000 truy vấn mỗi ngày [1]
Gemini Pro Mô hình được cập nhật lần gần đây nhất Tháng 2 năm 2024
Mã kiểu máy models/gemini-pro
Chức năng của mô hình
  • Phương thức nhập: văn bản
  • Đầu ra: văn bản
  • Tạo văn bản.
  • Có thể xử lý định dạng trò chuyện nhiều lượt.
  • Có thể xử lý các tác vụ không cần thiết, một và vài lần.
Các phương thức tạo được hỗ trợ generateContent
Giới hạn mã thông báo đầu vào 30720
Giới hạn mã thông báo đầu ra 2048
Độ an toàn của mô hình Các chế độ cài đặt an toàn được áp dụng tự động mà nhà phát triển có thể điều chỉnh. Hãy xem chủ đề chế độ cài đặt an toàn để biết thông tin chi tiết.
Giới hạn số lượng yêu cầu 60 yêu cầu mỗi phút [1]
Tên mô hình
  • Phiên bản mới nhất: gemini-1.0-pro-latest
  • Phiên bản ổn định mới nhất: gemini-1.0-pro
  • Phiên bản ổn định:
    • gemini-1.0-pro-001
Tầm nhìn Gemini 1.0 Pro Mô hình được cập nhật lần gần đây nhất Tháng 12 năm 2023
Mã kiểu máy models/gemini-pro-vision
Chức năng của mô hình
  • Dữ liệu đầu vào: văn bản và hình ảnh
  • Đầu ra: văn bản
  • Có thể nhận dữ liệu đầu vào đa phương thức, văn bản và hình ảnh.
  • Có thể xử lý các tác vụ không cần thiết, một và vài lần.
Các phương thức tạo được hỗ trợ generateContent
Giới hạn mã thông báo đầu vào 12288
Giới hạn mã thông báo đầu ra 4096
Độ an toàn của mô hình Các chế độ cài đặt an toàn được áp dụng tự động mà nhà phát triển có thể điều chỉnh. Hãy xem chủ đề chế độ cài đặt an toàn để biết thông tin chi tiết.
Giới hạn số lượng yêu cầu 60 yêu cầu mỗi phút [1]
Nhúng Mô hình được cập nhật lần gần đây nhất Tháng 12 năm 2023
Mã kiểu máy models/embedding-001
Chức năng của mô hình
  • Phương thức nhập: văn bản
  • Đầu ra: văn bản
  • Tạo các hoạt động nhúng văn bản cho văn bản đầu vào.
  • Tối ưu hoá để tạo nhúng văn bản có tối đa 2048 mã thông báo.
Các phương thức tạo được hỗ trợ embedContent
Độ an toàn của mô hình Không có chế độ cài đặt an toàn nào có thể điều chỉnh.
Giới hạn số lượng yêu cầu 1500 yêu cầu mỗi phút [1]
Nhúng văn bản Mô hình được cập nhật lần gần đây nhất Tháng 4 năm 2024
Mã kiểu máy models/text-embedding-004 (text-embedding-preview-0409 trong Vertex AI)
Chức năng của mô hình
  • Phương thức nhập: văn bản
  • Đầu ra: văn bản
  • Tạo các hoạt động nhúng văn bản cho văn bản đầu vào.
  • Hỗ trợ kích thước nhúng đàn hồi dưới 768.
Các phương thức tạo được hỗ trợ embedContent
Độ an toàn của mô hình Không có chế độ cài đặt an toàn nào có thể điều chỉnh.
Giới hạn số lượng yêu cầu 1500 yêu cầu mỗi phút [1]
AQA (Chỉ số chất lượng không khí) Mô hình được cập nhật lần gần đây nhất Tháng 12 năm 2023
Mã kiểu máy models/aqa
Chức năng của mô hình
  • Phương thức nhập: văn bản
  • Đầu ra: văn bản
  • Mô hình thực hiện Trả lời câu hỏi được phân bổ.
  • Mô hình được huấn luyện để trả về câu trả lời cho các câu hỏi dựa trên các nguồn được cung cấp, cùng với việc ước tính xác suất có thể trả lời.
Các phương thức tạo được hỗ trợ generateAnswer
Ngôn ngữ được hỗ trợ Tiếng Anh
Giới hạn mã thông báo đầu vào 7168
Giới hạn mã thông báo đầu ra 1024
Độ an toàn của mô hình Các chế độ cài đặt an toàn được áp dụng tự động mà nhà phát triển có thể điều chỉnh. Hãy xem chủ đề chế độ cài đặt an toàn để biết thông tin chi tiết.
Giới hạn số lượng yêu cầu 60 yêu cầu mỗi phút [1]

Hãy xem ví dụ để khám phá khả năng của các biến thể mô hình này.

Siêu dữ liệu về mô hình

Sử dụng API ModelService để nhận siêu dữ liệu bổ sung về các mô hình mới nhất, chẳng hạn như giới hạn của mã thông báo đầu vào và đầu ra. Bảng sau đây hiển thị siêu dữ liệu cho biến thể mô hình Gemini Pro.

Thuộc tính Giá trị
Tên hiển thị Gemini 1.0 Pro
Mã kiểu máy models/gemini-1.0-pro
Nội dung mô tả Mô hình được nhắm mục tiêu để tạo văn bản
Các phương thức tạo được hỗ trợ generateContent
Nhiệt độ 0,9
top_p 1
top_k 1

Thuộc tính của mô hình

Bảng sau đây mô tả các thuộc tính của mô hình Gemini phổ biến cho tất cả biến thể mô hình.

Thuộc tính Nội dung mô tả
Dữ liệu huấn luyện Điểm ngắt kiến thức của Gemini là đầu năm 2023. Kiến thức về các sự kiện sau thời gian đó bị hạn chế.
Ngôn ngữ được hỗ trợ Xem các ngôn ngữ được hỗ trợ
Thông số của mô hình có thể định cấu hình
  • Bàn trên cùng
  • K trên cùng
  • Nhiệt độ
  • Dừng trình tự
  • Thời lượng đầu ra tối đa
  • Số lượng ứng viên trả lời

[1] Do giới hạn về dung lượng, chúng tôi không đảm bảo các giới hạn số lượng yêu cầu tối đa đã chỉ định.

Hãy xem phần tham số mô hình trong hướng dẫn Giới thiệu về LLM để biết thông tin về từng thông số này.

Các bước tiếp theo