Bạn có thể sử dụng các mô hình Gemini để thúc đẩy nghiên cứu cơ bản trên nhiều lĩnh vực. Sau đây là những cách bạn có thể khám phá Gemini cho nghiên cứu của mình:
- Phân tích và kiểm soát kết quả của mô hình: Để phân tích thêm, bạn có thể xem xét một
ứng viên phản hồi do mô hình tạo bằng các công cụ như
CitationMetadata. Bạn cũng có thể định cấu hình các lựa chọn cho quá trình tạo và kết quả của mô hình, chẳng hạn nhưresponseSchema,topPvàtopK. Tìm hiểu thêm. - Đầu vào đa phương thức: Gemini có thể xử lý hình ảnh, âm thanh và video, mở ra vô vàn hướng nghiên cứu thú vị. Tìm hiểu thêm.
- Khả năng xử lý ngữ cảnh dài: Gemini 3.0 Flash và Pro có cửa sổ ngữ cảnh 1 triệu token. Tìm hiểu thêm.
- Grow with Google: Nhanh chóng truy cập vào các mô hình Gemini thông qua API và Google AI Studio cho các trường hợp sử dụng trong quá trình sản xuất. Nếu bạn đang tìm kiếm một nền tảng dựa trên Google Cloud, thì Nền tảng tác nhân Gemini Enterprise có thể cung cấp thêm cơ sở hạ tầng hỗ trợ.
Để hỗ trợ nghiên cứu học thuật và thúc đẩy nghiên cứu tiên tiến, Google cung cấp quyền truy cập vào các khoản tín dụng Gemini API cho các nhà khoa học và nhà nghiên cứu học thuật thông qua Chương trình học thuật Gemini.
Làm quen với Gemini
API Gemini và Google AI Studio giúp bạn bắt đầu làm việc với các mô hình mới nhất của Google và biến ý tưởng của bạn thành các ứng dụng có thể mở rộng.
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="How large is the universe?",
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "How large is the universe?",
});
console.log(response.text);
}
await main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[{"text": "How large is the universe?"}]
}]
}'
Học giả nổi bật
"Nghiên cứu của chúng tôi điều tra Gemini với tư cách là một mô hình ngôn ngữ trực quan (VLM) và các hành vi của tác nhân trong nhiều môi trường từ góc độ tính mạnh mẽ và an toàn. Cho đến nay, chúng tôi đã đánh giá tính mạnh mẽ của Gemini trước các yếu tố gây xao nhãng như cửa sổ bật lên khi các tác nhân VLM thực hiện các tác vụ trên máy tính, đồng thời đã tận dụng Gemini để phân tích tương tác xã hội, các sự kiện theo thời gian cũng như các yếu tố rủi ro dựa trên đầu vào video."
"Gemini Pro và Flash, với cửa sổ ngữ cảnh dài, đã giúp chúng tôi trong OK-Robot, dự án thao tác trên thiết bị di động có từ vựng mở của chúng tôi. Gemini cho phép các truy vấn và lệnh bằng ngôn ngữ tự nhiên phức tạp trên "bộ nhớ" của robot: trong trường hợp này, đó là các quan sát trước đây mà robot đã thực hiện trong một khoảng thời gian hoạt động dài. Tôi và Mahi Shafiullah cũng đang sử dụng Gemini để phân tách các tác vụ thành mã mà robot có thể thực thi trong thế giới thực."
Chương trình học thuật Gemini
Các nhà nghiên cứu học thuật đủ điều kiện (chẳng hạn như giảng viên, nhân viên và sinh viên tiến sĩ) ở các quốc gia được hỗ trợ có thể đăng ký để nhận các khoản tín dụng Gemini API và hạn mức cao hơn cho các dự án nghiên cứu. Sự hỗ trợ này giúp tăng công suất cho các thí nghiệm khoa học và thúc đẩy nghiên cứu.
Chúng tôi đặc biệt quan tâm đến các lĩnh vực nghiên cứu trong phần sau, nhưng chúng tôi hoan nghênh các đơn đăng ký từ nhiều ngành khoa học:
Đánh giá và điểm chuẩn: Các phương pháp đánh giá được cộng đồng chứng thực có thể cung cấp tín hiệu hiệu suất mạnh mẽ trong các lĩnh vực như tính chính xác, an toàn, tuân thủ hướng dẫn, lập luận và lập kế hoạch.
Thúc đẩy khám phá khoa học vì lợi ích của nhân loại: Các ứng dụng tiềm năng của AI trong nghiên cứu khoa học liên ngành, bao gồm các lĩnh vực như bệnh hiếm gặp và bị bỏ quên, sinh học thực nghiệm, khoa học vật liệu, và tính bền vững.
Hiện thân và tương tác: Sử dụng các mô hình ngôn ngữ lớn để điều tra các tương tác mới trong các lĩnh vực AI hiện thân, tương tác xung quanh, robot học và tương tác giữa người và máy tính.
Các khả năng mới nổi: Khám phá các khả năng của tác nhân AI mới cần thiết để nâng cao khả năng suy luận và lập kế hoạch, cũng như cách mở rộng các khả năng trong quá trình suy luận (ví dụ: bằng cách sử dụng Gemini Flash).
Tương tác và hiểu biết đa phương thức: Xác định các khoảng trống và cơ hội cho các mô hình nền tảng đa phương thức để phân tích, suy luận và lập kế hoạch trên nhiều nhiệm vụ.
Điều kiện: Chỉ những cá nhân (giảng viên, nhà nghiên cứu hoặc tương đương) liên kết với một tổ chức học thuật hợp lệ hoặc tổ chức nghiên cứu học thuật mới có thể đăng ký. Xin lưu ý rằng quyền truy cập và các khoản tín dụng API sẽ được cấp và xoá theo quyết định của Google. Chúng tôi xem xét các đơn đăng ký hằng tháng.