使用 Gemini for Research 加速发现

Gemini 模型可用于推动各学科的基础研究。您可以通过以下方式探索 Gemini 来进行研究:

  • 微调:您可以针对各种模态微调 Gemini 模型,以推进您的研究。了解详情
  • 分析和控制模型输出:如需进一步分析,您可以使用 LogprobsCitationMetadata 等工具检查模型生成的候选回答。您还可以配置模型生成和输出的选项,例如 responseSchematopPtopK了解详情
  • 多模态输入:Gemini 可以处理图片、音频和视频,从而支持众多令人兴奋的研究方向。了解详情
  • 长上下文功能:Gemini 1.5 Flash 配备一个 100 万个词元的上下文窗口,而 Gemini 1.5 Pro 则配备一个 200 万个词元的上下文窗口。了解详情
  • 与 Google 一起成长:通过 API 和 Google AI Studio 快速访问 Gemini 模型,用于生产环境用例。如果您正在寻找基于 Google Cloud 的平台,Vertex AI 可以提供额外的支持基础架构。

为支持学术研究并推动尖端研究,Google 通过 Gemini 学术计划为科学家和学术研究人员提供 Gemini API 赠金。

开始使用 Gemini

Gemini API 和 Google AI Studio 可帮助您开始使用 Google 的最新模型,并将您的想法转化为可扩缩的应用。

Python

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("How large is the universe?")
print(response.text)

Node.js

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });

const prompt = "How large is the universe?";

const result = await model.generateContent(prompt);
console.log(result.response.text());

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

“我们的研究从稳健性和安全性角度,将 Gemini 视为视觉语言模型 (VLM),并研究了其在各种环境中的代理行为。到目前为止,我们已评估 Gemini 在 VLM 客服人员执行计算机任务时对弹出式窗口等干扰因素的鲁棒性,并利用 Gemini 基于视频输入分析社交互动、时间事件以及风险因素。”

“Gemini Pro 和 Flash 的长上下文窗口一直在帮助我们推进开放词汇移动操作项目 OK-Robot。Gemini 支持对机器人的“记忆”进行复杂的自然语言查询和命令:在本例中,就是机器人在长时间运行期间之前进行的观察。Mahi Shafiullah 和我还在使用 Gemini 将任务分解为机器人可以在现实世界中执行的代码。”

Gemini 学术计划

受支持的国家/地区内符合条件的学术研究人员(例如教职员工、职员和博士生)可以申请获得 Gemini API 赠金,并为研究项目申请更高的速率上限。这种支持可提高科学实验的吞吐量,并推动研究进步。

我们特别关注下一部分中列出的研究领域,但也欢迎来自各种科学学科的申请:

  • 评估和基准:社区认可的评估方法,可在事实性、安全性、指令遵从性、推理和规划等方面提供强有力的效果信号。

  • 加速科学发现,造福人类:AI 在跨学科科学研究中的潜在应用,包括罕见和被忽视的疾病、实验生物学、材料科学和可持续发展等领域。

  • 体现和互动:利用大语言模型研究体现式 AI、氛围互动、机器人和人机交互领域中的新型互动。

  • 新兴能力:探索增强推理和规划所需的新代理能力,以及如何在推理过程中扩展能力(例如,利用 Gemini Flash)。

  • 多模态交互和理解:找出多模态基础模型在各种任务中的分析、推理和规划方面的缺口和机遇。

资格要求:只有与有效的学术机构或学术研究组织相关联的个人(教职员工、研究人员或同等人员)才能申请。请注意,Google 会自行决定是否授予和移除 API 访问权限和赠金。我们会每月审核一次申请。

开始使用 Gemini API 进行研究

立即申请