Interactions API の一般提供を開始しました。この API を使用して、最新の機能とモデルにアクセスすることをおすすめします。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini API

すべての新しいプロジェクトに Interactions API を使用することをおすすめします。エージェントワークフロー、状態管理、最新モデル向けに最適化されています。詳しくは、Interactions API の概要をご覧ください。

Gemini、Veo、Nano Banana などを使用して、プロンプトから本番環境に移行する最も速い方法。

Python

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Explain how AI works in a few words"
)

print(interaction.output_text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const interaction = await ai.interactions.create({
  model: "gemini-3.5-flash",
  input: "Explain how AI works in a few words",
});

console.log(interaction.output_text);

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "gemini-3.5-flash",
    "input": "Explain how AI works in a few words"
  }'

構築を開始

クイックスタートガイドに沿って API キーを取得し、数分で最初の API 呼び出しを行います。

モデルの紹介

すべて表示

Gemini 3.1 Pro 新機能

Google の最もインテリジェントなモデルであり、マルチモーダル理解において世界最高水準のモデルです。最先端の推論技術を基盤として構築されています。

Gemini 3.5 Flash 新機能

わずかな費用で大規模なモデルに匹敵するフロンティアクラスのパフォーマンスを実現します。

Gemini 3.1 Flash-Lite 新機能

Gemini 3 シリーズのパフォーマンスと品質を備えた、大量のトラフィックをコスト重視で処理するモデルです。

Gemini 3 Flash

わずかな費用で大規模なモデルに匹敵するフロンティアクラスのパフォーマンスを実現します。

🍌 Nano Banana 2 と Nano Banana Pro

画像の生成と編集のための最先端モデル。

Veo 3.1

ネイティブ音声に対応した、Google の最先端の動画生成モデル。

Gemini Robotics

Gemini のエージェント機能をロボット工学に導入し、現実世界での高度な推論を可能にする視覚言語モデル（VLM）。

機能を確認する

ネイティブ画像生成（Nano Banana）

Gemini 2.5 Flash Image を使用して、コンテキストを高度に認識した画像をネイティブに生成、編集できます。

長いコンテキスト

Gemini モデルに数百万のトークンを入力し、非構造化画像、動画、ドキュメントから理解を得ます。

構造化出力

自動処理に適した構造化データ形式である JSON で応答するように Gemini を制約します。

関数呼び出し

Gemini を外部 API やツールに接続して、エージェントワークフローを構築します。

Veo 3.1 による動画生成

Google の最先端モデルを使用して、テキストまたは画像のプロンプトから高品質の動画コンテンツを作成します。

Live API を使用した音声エージェント

Live API を使用して、リアルタイムの音声アプリケーションとエージェントを構築します。

ツール

Google 検索、URL コンテキスト、Google マップ、コード実行、コンピュータの使用などの組み込みツールを使用して、Gemini を世界に接続します。

ドキュメントの理解

マルチモーダル理解またはその他のテキストベースのファイル形式を使用して、最大 1,000 ページの PDF ファイルを処理します。

思考

思考能力が複雑なタスクやエージェントの推論をどのように改善するかを確認します。