Đẩy nhanh quá trình khám phá bằng Gemini cho Nghiên cứu

Bạn có thể sử dụng các mô hình Gemini để thúc đẩy nghiên cứu cơ bản trên nhiều lĩnh vực. Sau đây là những cách bạn có thể khám phá Gemini để phục vụ cho việc nghiên cứu:

  • Tinh chỉnh: Bạn có thể tinh chỉnh các mô hình Gemini cho nhiều phương thức để nâng cao hiệu quả nghiên cứu. Tìm hiểu thêm.
  • Phân tích và kiểm soát kết quả đầu ra của mô hình: Để phân tích thêm, bạn có thể kiểm tra một đề xuất phản hồi do mô hình tạo bằng các công cụ như LogprobsCitationMetadata. Bạn cũng có thể định cấu hình các lựa chọn cho quá trình tạo mô hình và đầu ra, chẳng hạn như responseSchema, topPtopK. Tìm hiểu thêm.
  • Đầu vào đa phương thức: Gemini có thể xử lý hình ảnh, âm thanh và video, mở ra nhiều hướng nghiên cứu thú vị. Tìm hiểu thêm.
  • Khả năng xử lý ngữ cảnh dài: Gemini 1.5 Flash có cửa sổ ngữ cảnh 1 triệu token và Gemini 1.5 Pro có cửa sổ ngữ cảnh 2 triệu token. Tìm hiểu thêm.
  • Phát triển cùng Google: Nhanh chóng truy cập vào các mô hình Gemini thông qua API và Google AI Studio cho các trường hợp sử dụng trong thực tế. Nếu bạn đang tìm kiếm một nền tảng dựa trên Google Cloud, thì Vertex AI có thể cung cấp cơ sở hạ tầng hỗ trợ bổ sung.

Để hỗ trợ nghiên cứu học thuật và thúc đẩy nghiên cứu tiên tiến, Google cung cấp tín dụng Gemini API cho các nhà khoa học và nhà nghiên cứu học thuật thông qua Chương trình Gemini dành cho học thuật.

Làm quen với Gemini

Gemini API và Google AI Studio giúp bạn bắt đầu làm việc với các mô hình mới nhất của Google và biến ý tưởng của bạn thành các ứng dụng có thể mở rộng quy mô.

Python

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-2.0-flash",
    contents="How large is the universe?",
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash",
    contents: "How large is the universe?",
  });
  console.log(response.text);
}

await main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

"Nghiên cứu của chúng tôi xem xét Gemini như một mô hình ngôn ngữ thị giác (VLM) và hành vi dựa trên tác nhân của mô hình này trong nhiều môi trường từ góc độ độ tin cậy và an toàn. Cho đến nay, chúng tôi đã đánh giá độ mạnh mẽ của Gemini trước những yếu tố gây xao nhãng như cửa sổ bật lên khi các tác nhân VLM thực hiện các tác vụ trên máy tính, đồng thời tận dụng Gemini để phân tích hoạt động tương tác trên mạng xã hội, các sự kiện tạm thời cũng như các yếu tố rủi ro dựa trên dữ liệu đầu vào là video".

"Gemini Pro và Flash, với cửa sổ ngữ cảnh dài, đã giúp chúng tôi trong dự án thao tác trên thiết bị di động có từ vựng mở OK-Robot. Gemini cho phép đưa ra các câu hỏi và lệnh phức tạp bằng ngôn ngữ tự nhiên dựa trên "bộ nhớ" của rô bốt: trong trường hợp này, đó là những quan sát trước đây của rô bốt trong thời gian hoạt động dài. Mahi Shafiullah và tôi cũng đang sử dụng Gemini để phân tách các nhiệm vụ thành mã mà robot có thể thực thi trong thế giới thực."

Chương trình Gemini dành cho học thuật

Các nhà nghiên cứu học thuật đủ tiêu chuẩn (chẳng hạn như giảng viên, nhân viên và sinh viên tiến sĩ) ở các quốc gia được hỗ trợ có thể đăng ký nhận tín dụng Gemini API và hạn mức sử dụng cao hơn cho các dự án nghiên cứu. Nhờ sự hỗ trợ này, các thí nghiệm khoa học có thể đạt được thông lượng cao hơn và thúc đẩy nghiên cứu.

Chúng tôi đặc biệt quan tâm đến các lĩnh vực nghiên cứu trong phần sau, nhưng chúng tôi hoan nghênh các đơn đăng ký từ nhiều ngành khoa học:

  • Đánh giá và điểm chuẩn: Các phương pháp đánh giá được cộng đồng chứng thực có thể cung cấp tín hiệu mạnh mẽ về hiệu suất trong các lĩnh vực như tính xác thực, độ an toàn, khả năng tuân thủ hướng dẫn, khả năng lập luận và lập kế hoạch.

  • Đẩy nhanh quá trình khám phá khoa học để mang lại lợi ích cho nhân loại: Các ứng dụng tiềm năng của AI trong nghiên cứu khoa học liên ngành, bao gồm các lĩnh vực như bệnh hiếm gặp và bị bỏ quên, sinh học thực nghiệm, khoa học vật liệu và tính bền vững.

  • Hiện thân và tương tác: Sử dụng các mô hình ngôn ngữ lớn để nghiên cứu những hoạt động tương tác mới trong các lĩnh vực AI hiện thân, tương tác xung quanh, robot học và tương tác giữa người và máy tính.

  • Các khả năng mới nổi: Khám phá các khả năng mới của tác nhân cần thiết để nâng cao khả năng suy luận và lập kế hoạch, cũng như cách mở rộng các khả năng trong quá trình suy luận (ví dụ: bằng cách sử dụng Gemini Flash).

  • Tương tác và hiểu biết đa phương thức: Xác định những điểm thiếu sót và cơ hội cho các mô hình cơ bản đa phương thức để phân tích, suy luận và lập kế hoạch cho nhiều nhiệm vụ.

Điều kiện: Chỉ những cá nhân (giảng viên, nhà nghiên cứu hoặc người tương đương) có liên kết với một tổ chức giáo dục hợp lệ hoặc tổ chức nghiên cứu học thuật mới có thể đăng ký. Xin lưu ý rằng Google sẽ cấp và xoá quyền truy cập API cũng như tín dụng theo ý mình. Chúng tôi xem xét các đơn đăng ký hằng tháng.

Bắt đầu nghiên cứu bằng Gemini API

Đăng ký ngay