Đẩy nhanh quá trình khám phá bằng Gemini cho Nghiên cứu
Bạn có thể sử dụng các mô hình Gemini để phát triển nghiên cứu cơ bản trên nhiều lĩnh vực. Sau đây là một số cách bạn có thể khám phá Gemini để nghiên cứu:
- Chỉnh sửa chi tiết: Bạn có thể tinh chỉnh các mô hình Gemini cho nhiều phương thức để cải thiện nghiên cứu của mình. Tìm hiểu thêm.
- Phân tích và kiểm soát đầu ra của mô hình: Để phân tích thêm, bạn có thể kiểm tra đề xuất phản hồi do mô hình tạo bằng các công cụ như
Logprobs
vàCitationMetadata
. Bạn cũng có thể định cấu hình các tuỳ chọn để tạo mô hình và đầu ra, chẳng hạn nhưresponseSchema
,topP
vàtopK
. Tìm hiểu thêm. - Dữ liệu đầu vào đa phương thức: Gemini có thể xử lý hình ảnh, âm thanh và video, cho phép nhiều hướng nghiên cứu thú vị. Tìm hiểu thêm.
- Khả năng xử lý ngữ cảnh dài: Gemini 1.5 Flash có cửa sổ ngữ cảnh 1 triệu mã thông báo và Gemini 1.5 Pro có cửa sổ ngữ cảnh 2 triệu mã thông báo. Tìm hiểu thêm.
- Phát triển cùng Google: Truy cập nhanh vào các mô hình Gemini thông qua API và Google AI Studio cho các trường hợp sử dụng chính thức. Nếu bạn đang tìm kiếm một nền tảng dựa trên Google Cloud, Vertex AI có thể cung cấp thêm cơ sở hạ tầng hỗ trợ.
Để hỗ trợ nghiên cứu học thuật và thúc đẩy nghiên cứu tiên tiến, Google cung cấp quyền sử dụng tín dụng API Gemini cho các nhà khoa học và nhà nghiên cứu học thuật thông qua Chương trình học thuật Gemini.
Bắt đầu sử dụng Gemini
Gemini API và Google AI Studio giúp bạn bắt đầu làm việc với các mô hình mới nhất của Google và biến ý tưởng của bạn thành các ứng dụng có thể mở rộng quy mô.
Python
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("How large is the universe?")
print(response.text)
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });
const prompt = "How large is the universe?";
const result = await model.generateContent(prompt);
console.log(result.response.text());
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts":[{"text": "How large is the universe?"}]
}]
}'
Học giả nổi bật
"Nghiên cứu của chúng tôi xem xét Gemini dưới dạng một mô hình ngôn ngữ hình ảnh (VLM) và hành vi tác nhân của mô hình này trong nhiều môi trường từ góc độ độ mạnh mẽ và an toàn. Cho đến nay, chúng tôi đã đánh giá khả năng chống phân tâm của Gemini trước các yếu tố như cửa sổ bật lên khi các tác nhân VLM thực hiện các tác vụ trên máy tính, đồng thời đã tận dụng Gemini để phân tích hoạt động tương tác xã hội, các sự kiện theo thời gian cũng như các yếu tố rủi ro dựa trên dữ liệu đầu vào dạng video".
"Gemini Pro và Flash, với cửa sổ ngữ cảnh dài, đã giúp chúng tôi trong OK-Robot, dự án thao tác trên thiết bị di động bằng từ vựng mở. Gemini cho phép các truy vấn và lệnh bằng ngôn ngữ tự nhiên phức tạp trên "bộ nhớ" của rô-bốt: trong trường hợp này, các quan sát trước đó mà rô-bốt thực hiện trong một khoảng thời gian hoạt động dài. Mahi Shafiullah và tôi cũng đang sử dụng Gemini để phân ly các tác vụ thành mã mà robot có thể thực thi trong thế giới thực."
Chương trình học thuật của Gemini
Các nhà nghiên cứu học thuật đủ điều kiện (chẳng hạn như giảng viên, nhân viên và sinh viên tiến sĩ) ở các quốc gia được hỗ trợ có thể đăng ký nhận tín dụng Gemini API và giới hạn tốc độ cao hơn cho các dự án nghiên cứu. Tính năng hỗ trợ này giúp tăng thông lượng cho các thử nghiệm khoa học và nghiên cứu nâng cao.
Chúng tôi đặc biệt quan tâm đến các lĩnh vực nghiên cứu trong phần sau, nhưng chúng tôi hoan nghênh các ứng dụng từ nhiều ngành khoa học:
Đánh giá và điểm chuẩn: Các phương pháp đánh giá được cộng đồng chứng thực có thể cung cấp tín hiệu hiệu suất mạnh mẽ trong các lĩnh vực như tính xác thực, sự an toàn, việc làm theo hướng dẫn, suy luận và lập kế hoạch.
Thúc đẩy khám phá khoa học để mang lại lợi ích cho nhân loại: Các ứng dụng tiềm năng của AI trong nghiên cứu khoa học liên ngành, bao gồm các lĩnh vực như bệnh hiếm và bị bỏ qua, sinh học thử nghiệm, khoa học vật liệu và tính bền vững.
Tương tác và hiện thân: Sử dụng các mô hình ngôn ngữ lớn để nghiên cứu các hoạt động tương tác mới trong các lĩnh vực AI hiện thân, tương tác môi trường xung quanh, robot và tương tác giữa người và máy.
Các khả năng mới nổi: Khám phá các khả năng mới của tác nhân cần thiết để cải thiện khả năng suy luận và lập kế hoạch, cũng như cách mở rộng các khả năng trong quá trình suy luận (ví dụ: bằng cách sử dụng Gemini Flash).
Tương tác và hiểu biết đa phương thức: Xác định các khoảng trống và cơ hội cho các mô hình cơ bản đa phương thức để phân tích, suy luận và lập kế hoạch cho nhiều nhiệm vụ.
Điều kiện: Chỉ những cá nhân (thành viên khoa, nhà nghiên cứu hoặc tương đương) liên kết với một học viện hoặc tổ chức nghiên cứu học thuật hợp lệ mới có thể đăng ký. Xin lưu ý rằng quyền truy cập vào API và khoản tín dụng sẽ được cấp và xoá theo quyết định của Google. Chúng tôi xem xét các đơn đăng ký hằng tháng.