すべての新しいプロジェクトに Interactions API を使用することをおすすめします。エージェント ワークフロー、状態管理、最新モデル向けに最適化されています。詳しくは、Interactions API の概要をご覧ください。
Gemini、Veo、Nano Banana などを使用して、プロンプトから本番環境に移行する最も速い方法。
Python
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3.5-flash",
input="Explain how AI works in a few words"
)
print(interaction.output_text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const interaction = await ai.interactions.create({
model: "gemini-3.5-flash",
input: "Explain how AI works in a few words",
});
console.log(interaction.output_text);
REST
curl -X POST "https://generativelanguage.googleapis.com/v1beta/interactions" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "gemini-3.5-flash",
"input": "Explain how AI works in a few words"
}'
クイックスタート ガイドに沿って API キーを取得し、数分で最初の API 呼び出しを行います。
モデルの紹介
すべて表示Gemini 3.1 Pro 新機能
Google の最もインテリジェントなモデルであり、マルチモーダル理解において世界最高水準のモデルです。最先端の推論技術を基盤として構築されています。
Gemini 3.5 Flash 新機能
わずかな費用で大規模なモデルに匹敵するフロンティア クラスのパフォーマンスを実現します。
Gemini 3.1 Flash-Lite 新機能
Gemini 3 シリーズのパフォーマンスと品質を備えた、大量のトラフィックをコスト重視で処理するモデルです。
Gemini 3 Flash
わずかな費用で大規模なモデルに匹敵するフロンティア クラスのパフォーマンスを実現します。
🍌 Nano Banana 2 と Nano Banana Pro
画像の生成と編集のための最先端モデル。
Veo 3.1
ネイティブ音声に対応した、Google の最先端の動画生成モデル。
Gemini Robotics
Gemini のエージェント機能をロボット工学に導入し、現実世界での高度な推論を可能にする視覚言語モデル(VLM)。
機能を確認する
ネイティブ画像生成(Nano Banana)
Gemini 2.5 Flash Image を使用して、コンテキストを高度に認識した画像をネイティブに生成、編集できます。
長いコンテキスト
Gemini モデルに数百万のトークンを入力し、非構造化画像、動画、ドキュメントから理解を得ます。
構造化出力
自動処理に適した構造化データ形式である JSON で応答するように Gemini を制約します。
関数呼び出し
Gemini を外部 API やツールに接続して、エージェント ワークフローを構築します。
Veo 3.1 による動画生成
Google の最先端モデルを使用して、テキストまたは画像のプロンプトから高品質の動画コンテンツを作成します。
Live API を使用した音声エージェント
Live API を使用して、リアルタイムの音声アプリケーションとエージェントを構築します。
ツール
Google 検索、URL コンテキスト、Google マップ、コード実行、コンピュータの使用などの組み込みツールを使用して、Gemini を世界に接続します。
ドキュメントの理解
マルチモーダル理解またはその他のテキストベースのファイル形式を使用して、最大 1,000 ページの PDF ファイルを処理します。
思考
思考能力が複雑なタスクやエージェントの推論をどのように改善するかを確認します。