使用 Gemini for Research 加速探索

Gemini 模型可用於推進各領域的基礎研究。 以下說明如何使用 Gemini 進行研究:

  • 微調:您可以微調各種模態的 Gemini 模型,進一步推進研究。瞭解詳情
  • 分析及控制模型輸出內容:如要進一步分析,可以使用 LogprobsCitationMetadata 等工具檢查模型生成的候選回應。您也可以設定模型生成和輸出選項,例如 responseSchematopPtopK瞭解詳情
  • 多模態輸入內容:Gemini 可處理圖片、音訊和影片,因此有許多令人期待的研究方向。瞭解詳情
  • 長脈絡功能:Gemini 1.5 Flash 的脈絡窗口最多可支援 100 萬個詞元,Gemini 1.5 Pro 則最多可支援 200 萬個詞元。瞭解詳情
  • Google 成長計畫:透過 API 和 Google AI Studio 快速存取 Gemini 模型,用於生產用途。如果您正在尋找 Google Cloud 平台,Vertex AI 可提供額外的支援基礎架構。

為支援學術研究並推動尖端研究,Google 透過 Gemini 學術計畫,為科學家和學術研究人員提供 Gemini API 抵免額。

開始使用 Gemini

透過 Gemini API 和 Google AI Studio,您可以開始使用 Google 的最新模型,並將構想化為可擴充的應用程式。

Python

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-2.0-flash",
    contents="How large is the universe?",
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash",
    contents: "How large is the universe?",
  });
  console.log(response.text);
}

await main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

「我們的研究從穩健性和安全性的角度,探討 Gemini 做為視覺語言模型 (VLM) 的能力,以及在各種環境中的代理行為。到目前為止,我們已評估 Gemini 在 VLM 代理程式執行電腦工作時,面對彈出式視窗等干擾的強健程度,並運用 Gemini 分析社交互動、時間事件,以及根據影片輸入內容判斷風險因素。」

「Gemini Pro 和 Flash 具有長脈絡窗口,有助於我們進行 OK-Robot (開放式詞彙行動操控專案)。Gemini 可透過機器人的「記憶體」執行複雜的自然語言查詢和指令,也就是機器人在長時間運作期間所做的觀察。我和 Mahi Shafiullah 也使用 Gemini 將工作分解為程式碼,讓機器人可以在現實世界中執行。」

Gemini 學術計畫

支援國家/地區的合格學術研究人員 (例如教職員和博士生) 可申請 Gemini API 抵免額和更高的頻率限制,用於研究專案。這項支援可提高科學實驗的輸送量,並推進研究進展。

我們特別感興趣的研究領域如下一節所述,但我們也歡迎來自不同科學領域的申請:

  • 評估和基準:社群認可的評估方法,可提供事實性、安全性、指令遵循、推理和規劃等領域的強大效能信號。

  • 加速科學探索,造福人類:AI 在跨領域科學研究中的潛在應用,包括罕見和被忽略的疾病、實驗生物學、材料科學和永續發展等領域。

  • 具體化和互動:運用大型語言模型,在具體化 AI、環境互動、機器人和人機互動領域中,探索新穎的互動方式。

  • 新興功能:探索強化推理和規劃能力所需的新代理功能,以及如何在推論期間擴展功能 (例如使用 Gemini Flash)。

  • 多模態互動和理解:找出多模態基礎模型的缺口和機會,以便分析、推論及規劃各種工作。

資格:只有隸屬於有效學術機構或學術研究機構的個人 (教職員、研究人員或同等人員) 才能申請。請注意,Google 可全權決定是否核准 API 存取權和抵免額,以及是否移除這些權限。我們每個月都會審查申請。

開始使用 Gemini API 進行研究

立即申請