Gemini for Research で発見を加速

Gemini モデルは、学問分野を横断する基礎研究の進歩に使用できます。調査に Gemini を活用する方法は次のとおりです。

  • ファインチューニング: さまざまなモダリティに合わせて Gemini モデルをファインチューニングして、研究を進めることができます。詳細
  • モデルの出力を分析して制御する: 詳細な分析を行うには、LogprobsCitationMetadata などのツールを使用して、モデルによって生成されたレスポンス候補を調べます。モデルの生成と出力のオプション(responseSchematopPtopK など)を構成することもできます。詳細
  • マルチモーダル入力: Gemini は画像、音声、動画を処理できるため、さまざまな魅力的な研究分野を切り開くことができます。詳細
  • 長いコンテキストの機能: Gemini 1.5 Flash には 100 万トークンのコンテキスト ウィンドウが搭載されています。Gemini 1.5 Pro には 200 万トークンのコンテキスト ウィンドウが搭載されています。詳細
  • Google と成長する: API と Google AI Studio を使用して Gemini モデルに迅速にアクセスし、本番環境のユースケースに対応します。Google Cloud ベースのプラットフォームをお探しの場合は、Vertex AI で追加のサポート インフラストラクチャを利用できます。

学術研究を支援し、最先端の研究を推進するため、Google は Gemini アカデミック プログラムを通じて、科学者や学術研究者向けに Gemini API クレジットへのアクセスを提供しています。

Gemini の利用を開始しよう

Gemini API と Google AI Studio を使用すると、Google の最新モデルをすぐに使用し、アイデアをスケーラブルなアプリケーションに変換できます。

Python

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-1.5-flash")
response = model.generate_content("How large is the universe?")
print(response.text)

Node.js

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });

const prompt = "How large is the universe?";

const result = await model.generateContent(prompt);
console.log(result.response.text());

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

「この研究では、Gemini を視覚言語モデル(VLM)として調査し、堅牢性と安全性の観点から、さまざまな環境でのエージェント行動を調査しています。これまでのところ、VLM エージェントがコンピュータ タスクを実行する際にポップアップ ウィンドウなどの気を散らすものに対する Gemini の堅牢性を評価し、Gemini を活用して、動画入力に基づくソーシャル インタラクション、時間的イベント、リスク要因を分析してきました。」

「Gemini Pro と Flash は、長いコンテキスト ウィンドウを備えており、オープン ボキャブラリのモバイル操作プロジェクトである OK-Robot で役立っています。Gemini は、ロボットの「メモリ」(この場合は、ロボットが長時間の運用中に行った以前の観測)に対して複雑な自然言語クエリとコマンドを実行できるようにします。Mahi Shafiullah と私は、Gemini を使用してタスクを分解し、ロボットが現実世界で実行できるコードに変換しています。」

Gemini アカデミック プログラム

サポートされている国の資格要件を満たす学術研究者(教員、スタッフ、博士課程の学生など)は、Gemini API クレジットと研究プロジェクトのレート上限の引き上げを申請できます。このサポートにより、科学実験の処理能力が向上し、研究が進展します。

特に、次のセクションに記載されている研究分野に興味がありますが、さまざまな科学分野からの応募を歓迎します。

  • 評価とベンチマーク: 事実性、安全性、指示の遵守、推論、計画などの分野で強力なパフォーマンス シグナルを提供できる、コミュニティが承認した評価方法。

  • 科学的発見を加速して人類に貢献する: 希少疾患や軽視されている疾患、実験生物学、材料科学、持続可能性などの分野を含む、学際的な科学研究における AI の潜在的な応用。

  • エンベディングとインタラクション: 大規模言語モデルを使用して、エンベディング AI、アンビエント インタラクション、ロボット工学、ヒューマン コンピュータ インタラクションの分野における新しいインタラクションを調査します。

  • 新しい能力: 推論と計画の強化に必要な新しいエージェント能力と、推論中に能力を拡張する方法(Gemini Flash の利用など)を探ります。

  • マルチモーダル インタラクションと理解: さまざまなタスクにわたる分析、推論、計画のためのマルチモーダル基盤モデルのギャップと機会を特定します。

資格要件: 有効な学術機関または学術研究機関に所属する個人(教員、研究者、または同等の者)のみが申請できます。API アクセスとクレジットの付与と削除は Google の裁量により行われます。申請は毎月審査されます。

Gemini API を使用して調査を開始する

今すぐ申し込む