Gemini の思考

Gemini 3 および 2.5 シリーズのモデルは、推論と多段階計画の能力を大幅に向上させる内部の「思考プロセス」を使用しており、コーディング、高度な数学、データ分析などの複雑なタスクに非常に効果的です。

このガイドでは、Gemini API を使用して Gemini の思考機能を操作する方法について説明します。

思考を伴うコンテンツの生成

思考モデルでリクエストを開始する手順は、他のコンテンツ生成リクエストと同様です。主な違いは、次のテキスト生成の例に示すように、model フィールドで思考をサポートするモデルのいずれかを指定することです。

Python

from google import genai

client = genai.Client()
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents=prompt
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";

  const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: prompt,
  });

  console.log(response.text);
}

main();

Go

package main

import (
  "context"
  "fmt"
  "log"
  "os"
  "google.golang.org/genai"
)

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  prompt := "Explain the concept of Occam's Razor and provide a simple, everyday example."
  model := "gemini-3-flash-preview"

  resp, _ := client.Models.GenerateContent(ctx, model, genai.Text(prompt), nil)

  fmt.Println(resp.Text())
}

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
 -H "x-goog-api-key: $GEMINI_API_KEY" \
 -H 'Content-Type: application/json' \
 -X POST \
 -d '{
   "contents": [
     {
       "parts": [
         {
           "text": "Explain the concept of Occam'\''s Razor and provide a simple, everyday example."
         }
       ]
     }
   ]
 }'
 ```

思考の要約

思考の要約は、モデルの生の思考を要約したもので、モデルの内部推論プロセスに関する分析情報を提供します。思考レベルと予算は、モデルの生の思考に適用され、思考の要約には適用されません。

リクエスト構成で includeThoughts を true に設定すると、思考の要約を有効にできます。概要にアクセスするには、response パラメータの parts を反復処理し、thought ブール値を確認します。

ストリーミングなしで思考の要約を有効にして取得する方法を示す例を次に示します。この例では、レスポンスとともに単一の最終的な思考の要約が返されます。

Python

from google import genai
from google.genai import types

client = genai.Client()
prompt = "What is the sum of the first 50 prime numbers?"
response = client.models.generate_content(
  model="gemini-3-flash-preview",
  contents=prompt,
  config=types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(
      include_thoughts=True
    )
  )
)

for part in response.candidates[0].content.parts:
  if not part.text:
    continue
  if part.thought:
    print("Thought summary:")
    print(part.text)
    print()
  else:
    print("Answer:")
    print(part.text)
    print()

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: "What is the sum of the first 50 prime numbers?",
    config: {
      thinkingConfig: {
        includeThoughts: true,
      },
    },
  });

  for (const part of response.candidates[0].content.parts) {
    if (!part.text) {
      continue;
    }
    else if (part.thought) {
      console.log("Thoughts summary:");
      console.log(part.text);
    }
    else {
      console.log("Answer:");
      console.log(part.text);
    }
  }
}

main();

Go

package main

import (
  "context"
  "fmt"
  "google.golang.org/genai"
  "os"
)

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  contents := genai.Text("What is the sum of the first 50 prime numbers?")
  model := "gemini-3-flash-preview"
  resp, _ := client.Models.GenerateContent(ctx, model, contents, &genai.GenerateContentConfig{
    ThinkingConfig: &genai.ThinkingConfig{
      IncludeThoughts: true,
    },
  })

  for _, part := range resp.Candidates[0].Content.Parts {
    if part.Text != "" {
      if part.Thought {
        fmt.Println("Thoughts Summary:")
        fmt.Println(part.Text)
      } else {
        fmt.Println("Answer:")
        fmt.Println(part.Text)
      }
    }
  }
}

ストリーミングによる思考を使用して、生成中にローリング増分要約を返す例を次に示します。

Python

from google import genai
from google.genai import types

client = genai.Client()

prompt = """
Alice, Bob, and Carol each live in a different house on the same street: red, green, and blue.
The person who lives in the red house owns a cat.
Bob does not live in the green house.
Carol owns a dog.
The green house is to the left of the red house.
Alice does not own a cat.
Who lives in each house, and what pet do they own?
"""

thoughts = ""
answer = ""

for chunk in client.models.generate_content_stream(
    model="gemini-3-flash-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
      thinking_config=types.ThinkingConfig(
        include_thoughts=True
      )
    )
):
  for part in chunk.candidates[0].content.parts:
    if not part.text:
      continue
    elif part.thought:
      if not thoughts:
        print("Thoughts summary:")
      print(part.text)
      thoughts += part.text
    else:
      if not answer:
        print("Answer:")
      print(part.text)
      answer += part.text

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const prompt = `Alice, Bob, and Carol each live in a different house on the same
street: red, green, and blue. The person who lives in the red house owns a cat.
Bob does not live in the green house. Carol owns a dog. The green house is to
the left of the red house. Alice does not own a cat. Who lives in each house,
and what pet do they own?`;

let thoughts = "";
let answer = "";

async function main() {
  const response = await ai.models.generateContentStream({
    model: "gemini-3-flash-preview",
    contents: prompt,
    config: {
      thinkingConfig: {
        includeThoughts: true,
      },
    },
  });

  for await (const chunk of response) {
    for (const part of chunk.candidates[0].content.parts) {
      if (!part.text) {
        continue;
      } else if (part.thought) {
        if (!thoughts) {
          console.log("Thoughts summary:");
        }
        console.log(part.text);
        thoughts = thoughts + part.text;
      } else {
        if (!answer) {
          console.log("Answer:");
        }
        console.log(part.text);
        answer = answer + part.text;
      }
    }
  }
}

await main();

Go

package main

import (
  "context"
  "fmt"
  "log"
  "os"
  "google.golang.org/genai"
)

const prompt = `
Alice, Bob, and Carol each live in a different house on the same street: red, green, and blue.
The person who lives in the red house owns a cat.
Bob does not live in the green house.
Carol owns a dog.
The green house is to the left of the red house.
Alice does not own a cat.
Who lives in each house, and what pet do they own?
`

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  contents := genai.Text(prompt)
  model := "gemini-3-flash-preview"

  resp := client.Models.GenerateContentStream(ctx, model, contents, &genai.GenerateContentConfig{
    ThinkingConfig: &genai.ThinkingConfig{
      IncludeThoughts: true,
    },
  })

  for chunk := range resp {
    for _, part := range chunk.Candidates[0].Content.Parts {
      if len(part.Text) == 0 {
        continue
      }

      if part.Thought {
        fmt.Printf("Thought: %s\n", part.Text)
      } else {
        fmt.Printf("Answer: %s\n", part.Text)
      }
    }
  }
}

思考の制御

Gemini モデルはデフォルトで動的思考を行い、ユーザーのリクエストの複雑さに基づいて推論の労力を自動的に調整します。ただし、特定のレイテンシの制約がある場合や、モデルが通常よりも深い推論を行う必要がある場合は、必要に応じてパラメータを使用して思考動作を制御できます。

思考レベル（Gemini 3）

Gemini 3 モデル以降で推奨される thinkingLevel パラメータを使用すると、推論の動作を制御できます。

次の表に、各モデルタイプの thinkingLevel 設定の詳細を示します。

思考レベル	Gemini 3 Pro	Gemini 3 Flash	説明
`minimal`	サポート対象外	サポート対象	ほとんどのクエリで「思考なし」の設定と一致します。複雑なコーディングタスクでは、モデルの思考が最小限になることがあります。チャットアプリケーションや高スループットアプリケーションのレイテンシを最小限に抑えます。なお、`minimal` は思考がオフになることを保証するものではありません。
`low`	サポート対象	サポート対象	レイテンシと費用を最小限に抑えます。シンプルな指示の実行、チャット、高スループットアプリケーションに最適です。
`medium`	サポート対象外	サポート対象	ほとんどのタスクでバランスの取れた思考を実現します。
`high`	サポートされている（デフォルト、動的）	サポートされている（デフォルト、動的）	推論の深さを最大化します。最初の（思考以外の）出力トークンに到達するまでに時間がかかることがありますが、出力はより慎重に推論されます。

次の例は、思考レベルを設定する方法を示しています。

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents="Provide a list of 3 famous physicists and their key contributions",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="low")
    ),
)

print(response.text)

JavaScript

import { GoogleGenAI, ThinkingLevel } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: "Provide a list of 3 famous physicists and their key contributions",
    config: {
      thinkingConfig: {
        thinkingLevel: ThinkingLevel.LOW,
      },
    },
  });

  console.log(response.text);
}

main();

Go

package main

import (
  "context"
  "fmt"
  "google.golang.org/genai"
  "os"
)

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  thinkingLevelVal := "low"

  contents := genai.Text("Provide a list of 3 famous physicists and their key contributions")
  model := "gemini-3-flash-preview"
  resp, _ := client.Models.GenerateContent(ctx, model, contents, &genai.GenerateContentConfig{
    ThinkingConfig: &genai.ThinkingConfig{
      ThinkingLevel: &thinkingLevelVal,
    },
  })

fmt.Println(resp.Text())
}

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [
    {
      "parts": [
        {
          "text": "Provide a list of 3 famous physicists and their key contributions"
        }
      ]
    }
  ],
  "generationConfig": {
    "thinkingConfig": {
          "thinkingLevel": "low"
    }
  }
}'

Gemini 3 Pro の思考を無効にすることはできません。Gemini 3 Flash も思考の完全なオフをサポートしていませんが、minimal 設定は、モデルが思考しない可能性が高いことを意味します（ただし、思考する可能性はあります）。思考レベルを指定しない場合、Gemini は Gemini 3 モデルのデフォルトの動的思考レベル "high" を使用します。

Gemini 2.5 シリーズモデルは thinkingLevel をサポートしていません。代わりに thinkingBudget を使用してください。

思考予算

Gemini 2.5 シリーズで導入された thinkingBudget パラメータは、推論に使用する思考トークンの特定の数に関するガイダンスをモデルに提供します。

以下に、各モデルタイプの thinkingBudget 構成の詳細を示します。思考を無効にするには、thinkingBudget を 0 に設定します。thinkingBudget を -1 に設定すると、動的思考が有効になります。つまり、モデルはリクエストの複雑さに基づいて予算を調整します。

モデル	デフォルト設定（思考予算が設定されていない）	範囲	思考プロセスを無効にする	動的な思考をオンにする
2.5 Pro	動的な思考	`128` から `32768`	N/A: 思考を無効にできない	`thinkingBudget = -1`（デフォルト）
2.5 Flash	動的な思考	`0` から `24576`	`thinkingBudget = 0`	`thinkingBudget = -1`（デフォルト）
2.5 Flash プレビュー	動的な思考	`0` から `24576`	`thinkingBudget = 0`	`thinkingBudget = -1`（デフォルト）
2.5 Flash Lite	モデルは思考しない	`512` から `24576`	`thinkingBudget = 0`	`thinkingBudget = -1`
2.5 Flash Lite プレビュー	モデルは思考しない	`512` から `24576`	`thinkingBudget = 0`	`thinkingBudget = -1`
Robotics-ER 1.5 プレビュー	動的な思考	`0` から `24576`	`thinkingBudget = 0`	`thinkingBudget = -1`（デフォルト）
2.5 Flash Live ネイティブ音声プレビュー（2025 年 9 月）	動的な思考	`0` から `24576`	`thinkingBudget = 0`	`thinkingBudget = -1`（デフォルト）

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents="Provide a list of 3 famous physicists and their key contributions",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_budget=1024)
        # Turn off thinking:
        # thinking_config=types.ThinkingConfig(thinking_budget=0)
        # Turn on dynamic thinking:
        # thinking_config=types.ThinkingConfig(thinking_budget=-1)
    ),
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: "Provide a list of 3 famous physicists and their key contributions",
    config: {
      thinkingConfig: {
        thinkingBudget: 1024,
        // Turn off thinking:
        // thinkingBudget: 0
        // Turn on dynamic thinking:
        // thinkingBudget: -1
      },
    },
  });

  console.log(response.text);
}

main();

Go

package main

import (
  "context"
  "fmt"
  "google.golang.org/genai"
  "os"
)

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  thinkingBudgetVal := int32(1024)

  contents := genai.Text("Provide a list of 3 famous physicists and their key contributions")
  model := "gemini-3-flash-preview"
  resp, _ := client.Models.GenerateContent(ctx, model, contents, &genai.GenerateContentConfig{
    ThinkingConfig: &genai.ThinkingConfig{
      ThinkingBudget: &thinkingBudgetVal,
      // Turn off thinking:
      // ThinkingBudget: int32(0),
      // Turn on dynamic thinking:
      // ThinkingBudget: int32(-1),
    },
  })

fmt.Println(resp.Text())
}

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [
    {
      "parts": [
        {
          "text": "Provide a list of 3 famous physicists and their key contributions"
        }
      ]
    }
  ],
  "generationConfig": {
    "thinkingConfig": {
          "thinkingBudget": 1024
    }
  }
}'

プロンプトによっては、モデルがトークン予算を超過または不足する可能性があります。

思考シグネチャ

Gemini API はステートレスであるため、モデルはすべての API リクエストを個別に処理し、マルチターンのやり取りで以前のターンの思考コンテキストにアクセスできません。

マルチターンインタラクションで思考コンテキストを維持できるようにするために、Gemini は思考シグネチャを返します。これは、モデルの内部思考プロセスを暗号化したものです。

Gemini 2.5 モデルは、思考が有効になっていて、リクエストに関数呼び出し（具体的には関数宣言）が含まれている場合に、思考シグネチャを返します。
Gemini 3 モデルは、すべてのタイプのパーツの思考シグネチャを返すことがあります。すべてのシグネチャをそのまま返すことをおすすめしますが、関数呼び出しシグネチャの場合は必須です。詳しくは、思考署名をご覧ください。

注: Gemini Flash 3 で minimal に設定されている場合でも、思考シグネチャの循環が必要です。

Google GenAI SDK は、思考シグネチャの戻り値を自動的に処理します。会話履歴を変更する場合や REST API を使用する場合は、思考シグネチャを手動で管理する必要があります。

関数呼び出しで考慮すべきその他の使用上の制限は次のとおりです。

シグネチャは、レスポンスの他の部分（関数呼び出しやテキストなど）からモデルによって返されます。その後のやり取りで、すべての部分を含むレスポンス全体をモデルに返します。
シグネチャを含むパートを連結しないでください。
シグネチャ付きのパートとシグネチャなしのパートを結合しないでください。

料金

思考が有効になっている場合、レスポンスの料金は出力トークンと思考トークンの合計になります。生成された思考トークンの合計数は、thoughtsTokenCount フィールドから取得できます。

Python

# ...
print("Thoughts tokens:",response.usage_metadata.thoughts_token_count)
print("Output tokens:",response.usage_metadata.candidates_token_count)

JavaScript

// ...
console.log(`Thoughts tokens: ${response.usageMetadata.thoughtsTokenCount}`);
console.log(`Output tokens: ${response.usageMetadata.candidatesTokenCount}`);

Go

// ...
usageMetadata, err := json.MarshalIndent(response.UsageMetadata, "", "  ")
if err != nil {
  log.Fatal(err)
}
fmt.Println("Thoughts tokens:", string(usageMetadata.thoughts_token_count))
fmt.Println("Output tokens:", string(usageMetadata.candidates_token_count))

思考モデルは、最終的なレスポンスの質を高めるために完全な思考を生成し、思考プロセスに関する分析情報を提供するために要約を出力します。そのため、API から出力されるのは要約のみですが、価格はモデルが要約を作成するために生成する必要があるすべての思考トークンに基づいています。

トークンの詳細については、トークン数のカウントのガイドをご覧ください。

ベストプラクティス

このセクションでは、思考モデルを効率的に使用するためのガイダンスを紹介します。いつものように、プロンプトのガイダンスとベストプラクティスに従うことで、最良の結果が得られます。

デバッグとステアリング

推論を確認する: 思考モデルから期待どおりの回答が得られない場合は、Gemini の思考の要約を慎重に分析すると役立ちます。タスクをどのように分解して結論に達したかを確認し、その情報を使用して正しい結果が得られるように修正できます。
推論でガイダンスを提供する: 特に長い出力を希望する場合は、プロンプトでガイダンスを指定して、モデルが使用する思考の量を制限することをおすすめします。これにより、レスポンス用にトークン出力をより多く予約できます。

タスクの複雑さ

簡単なタスク（思考をオフにできる）: 事実の取得や分類など、複雑な推論を必要としない簡単なリクエストの場合、思考は必要ありません。次のようなアプリケーションがあります。
- 「DeepMind はどこで設立されましたか？」
- 「このメールは会議を依頼するものですか、それとも情報提供のみですか？」
中程度のタスク（デフォルト/ある程度の思考）: 多くの一般的なリクエストは、段階的な処理やより深い理解によってメリットが得られます。Gemini は、次のようなタスクに思考能力を柔軟に活用できます。
- 光合成と成長を例える。
- 電気自動車とハイブリッド車を比較対照します。
難しいタスク（思考能力を最大限に活用）: 複雑な数学の問題やコーディングタスクなど、非常に複雑な課題には、思考予算を高く設定することをおすすめします。このようなタスクでは、モデルが推論と計画の機能を最大限に活用する必要があります。多くの場合、回答を提供する前に多くの内部ステップが必要になります。次のようなアプリケーションがあります。
- AIME 2025 の問題 1 を解きます。17_b が 97_b の約数となるすべての整数 b > 9 の合計を求めます。
- ユーザー認証を含む、リアルタイムの株式市場データを可視化するウェブアプリケーションの Python コードを作成します。できるだけ効率的にします。

サポートされているモデル、ツール、機能

思考機能は、3 シリーズと 2.5 シリーズのすべてのモデルでサポートされています。すべてのモデル機能については、モデルの概要ページをご覧ください。

思考モデルは、Gemini のすべてのツールと機能で動作します。これにより、モデルは外部システムとやり取りしたり、コードを実行したり、リアルタイム情報にアクセスしたりして、その結果を推論と最終的なレスポンスに組み込むことができます。

思考モデルでツールを使用する例については、思考クックブックをご覧ください。

次のステップ

思考カバレッジについては、OpenAI の互換性ガイドをご覧ください。

Gemini の思考

思考を伴うコンテンツの生成

Python

JavaScript

Go

REST

思考の要約

Python

JavaScript

Go

Python

JavaScript

Go

思考の制御

思考レベル（Gemini 3）

Python

JavaScript

Go

REST

思考予算

Python

JavaScript

Go

REST

思考シグネチャ

料金

Python

JavaScript

Go

ベスト プラクティス

デバッグとステアリング

タスクの複雑さ

サポートされているモデル、ツール、機能

次のステップ

ベストプラクティス