Tăng tốc độ khám phá bằng Gemini for Research
Bạn có thể sử dụng các mô hình Gemini để thúc đẩy nghiên cứu cơ bản trên nhiều lĩnh vực. Dưới đây là những cách bạn có thể khám phá Gemini cho nghiên cứu của mình:
- Phân tích và kiểm soát kết quả đầu ra của mô hình: Để phân tích thêm, bạn có thể kiểm tra một
ứng viên phản hồi do mô hình tạo bằng các công cụ như
CitationMetadata. Bạn cũng có thể định cấu hình các lựa chọn cho quá trình tạo và kết quả đầu ra của mô hình, chẳng hạn nhưresponseSchema,topPvàtopK. Tìm hiểu thêm. - Đầu vào đa phương thức: Gemini có thể xử lý hình ảnh, âm thanh và video, mở ra nhiều hướng nghiên cứu thú vị. Tìm hiểu thêm.
- Khả năng ngữ cảnh dài: Gemini 3.0 Flash và Pro có cửa sổ ngữ cảnh 1 triệu token. Tìm hiểu thêm.
- Grow with Google: Truy cập nhanh vào các mô hình Gemini thông qua API và Google AI Studio cho các trường hợp sử dụng trong quá trình sản xuất. Nếu bạn đang tìm kiếm một nền tảng dựa trên Google Cloud, thì Nền tảng tác nhân Gemini Enterprise có thể cung cấp thêm cơ sở hạ tầng hỗ trợ.
Để hỗ trợ nghiên cứu học thuật và thúc đẩy nghiên cứu tiên tiến, Google cung cấp quyền truy cập vào hạn mức Gemini API cho các nhà khoa học và nhà nghiên cứu học thuật thông qua Chương trình học thuật Gemini.
Làm quen với Gemini
Gemini API và Google AI Studio giúp bạn bắt đầu làm việc với các mô hình mới nhất của Google và biến ý tưởng của bạn thành các ứng dụng có khả năng mở rộng.
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="How large is the universe?",
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3-flash-preview",
contents: "How large is the universe?",
});
console.log(response.text);
}
await main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[{"text": "How large is the universe?"}]
}]
}'
Các nhà nghiên cứu học thuật nổi bật
"Nghiên cứu của chúng tôi điều tra Gemini như một mô hình ngôn ngữ trực quan (VLM) và hành vi của tác nhân trong nhiều môi trường từ góc độ tính ổn định và an toàn. Cho đến nay, chúng tôi đã đánh giá tính ổn định của Gemini trước các yếu tố gây xao nhãng như cửa sổ bật lên khi các tác nhân VLM thực hiện các tác vụ trên máy tính và đã tận dụng Gemini để phân tích tương tác xã hội, các sự kiện tạm thời cũng như các yếu tố rủi ro dựa trên đầu vào video."
"Gemini Pro và Flash, với cửa sổ ngữ cảnh dài, đã giúp chúng tôi trong OK-Robot, dự án thao tác trên thiết bị di động có từ vựng mở của chúng tôi. Gemini cho phép các truy vấn và lệnh bằng ngôn ngữ tự nhiên phức tạp trên "bộ nhớ" của robot: trong trường hợp này, các quan sát trước đây do robot thực hiện trong thời gian hoạt động dài. Mahi Shafiullah và tôi cũng đang sử dụng Gemini để phân tách các tác vụ thành mã mà robot có thể thực thi trong thế giới thực."
Chương trình học thuật Gemini
Các nhà nghiên cứu học thuật đủ điều kiện (chẳng hạn như giảng viên, nhân viên và sinh viên tiến sĩ) ở các quốc gia được hỗ trợ có thể đăng ký để nhận hạn mức Gemini API và hạn mức cao hơn cho các dự án nghiên cứu. Sự hỗ trợ này cho phép thông lượng cao hơn cho các thí nghiệm khoa học và thúc đẩy nghiên cứu.
Chúng tôi đặc biệt quan tâm đến các lĩnh vực nghiên cứu trong phần sau, nhưng chúng tôi hoan nghênh các đơn đăng ký từ nhiều lĩnh vực khoa học:
Đánh giá và điểm chuẩn: Các phương pháp đánh giá được cộng đồng chứng thực có thể cung cấp tín hiệu hiệu quả mạnh mẽ trong các lĩnh vực như tính xác thực, an toàn, tuân theo hướng dẫn, suy luận và lập kế hoạch.
Thúc đẩy khám phá khoa học để mang lại lợi ích cho nhân loại: Các ứng dụng tiềm năng của AI trong nghiên cứu khoa học liên ngành, bao gồm các lĩnh vực như bệnh hiếm gặp và bị bỏ quên, sinh học thực nghiệm, khoa học vật liệu, và tính bền vững.
Hiện thân và tương tác: Sử dụng các mô hình ngôn ngữ lớn để điều tra các tương tác mới trong các lĩnh vực AI hiện thân, tương tác xung quanh, robot học và tương tác giữa người và máy tính.
Khả năng mới nổi: Khám phá các khả năng của tác nhân AI mới cần thiết để nâng cao khả năng suy luận và lập kế hoạch, cũng như cách mở rộng khả năng trong quá trình suy luận (ví dụ: bằng cách sử dụng Gemini Flash).
Tương tác và hiểu biết đa phương thức: Xác định các khoảng trống và cơ hội cho các mô hình nền tảng đa phương thức để phân tích, suy luận và lập kế hoạch trên nhiều tác vụ.
Điều kiện: Chỉ những cá nhân (giảng viên, nhà nghiên cứu hoặc tương đương) liên kết với một tổ chức học thuật hợp lệ hoặc tổ chức nghiên cứu học thuật mới có thể đăng ký. Xin lưu ý rằng quyền truy cập API và hạn mức sẽ được cấp và xoá theo quyết định của Google. Chúng tôi xem xét các đơn đăng ký hằng tháng.