Tư duy của Gemini

Các mô hình trong dòng Gemini 2.5 sử dụng "quy trình tư duy" nội bộ trong quá trình tạo phản hồi. Quá trình này góp phần cải thiện khả năng suy luận của trẻ và giúp trẻ sử dụng phương pháp lập kế hoạch nhiều bước để giải quyết các nhiệm vụ phức tạp. Điều này giúp các mô hình này đặc biệt giỏi lập trình, toán học nâng cao, phân tích dữ liệu và các nhiệm vụ khác đòi hỏi phải lập kế hoạch hoặc suy nghĩ.

Dùng thử bản xem trước Flash của Gemini 2.5 trong Google AI Studio

Hướng dẫn này cho bạn biết cách làm việc với các chức năng tư duy của Gemini bằng cách sử dụng Gemini API.

Sử dụng mô hình tư duy

Các mô hình có khả năng suy nghĩ có trong Google AI Studio và thông qua Gemini API. Tính năng suy nghĩ được bật theo mặc định trong cả API và AI Studio vì các mô hình dòng 2.5 có khả năng tự động quyết định thời điểm và mức độ suy nghĩ dựa trên câu lệnh. Đối với hầu hết các trường hợp sử dụng, bạn nên bật tính năng suy nghĩ. Tuy nhiên, nếu muốn tắt tính năng suy nghĩ, bạn có thể thực hiện việc này bằng cách đặt tham số thinkingBudget thành 0.

Gửi yêu cầu cơ bản

PythonJavaScriptGoREST

from google import genai

client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents=prompt
)

print(response.text)

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: prompt,
  });

  console.log(response.text);
}

main();

// import packages here

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
  if err != nil {
    log.Fatal(err)
  }
  defer client.Close()

  model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
  resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
  if err != nil {
    log.Fatal(err)
  }
  fmt.Println(resp.Text())
}

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
 -H 'Content-Type: application/json' \
 -X POST \
 -d '{
   "contents": [
     {
       "parts": [
         {
           "text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
         }
       ]
     }
   ]
 }'
 ```

Đặt ngân sách cho mô hình tư duy

Tham số thinkingBudget cung cấp cho mô hình hướng dẫn về số lượng mã thông báo suy nghĩ mà mô hình có thể sử dụng khi tạo phản hồi. Số lượng mã thông báo lớn hơn thường liên quan đến tư duy chi tiết hơn, cần thiết để giải quyết các nhiệm vụ phức tạp hơn. thinkingBudget phải là số nguyên trong khoảng từ 0 đến 24576. Việc đặt ngân sách suy nghĩ thành 0 sẽ tắt tính năng suy nghĩ.

Tuỳ thuộc vào câu lệnh, mô hình có thể vượt quá hoặc không đủ ngân sách mã thông báo.

PythonJavaScriptREST

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents="Explain the Occam's Razor concept and provide everyday examples of it",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_budget=1024)
    ),
)

print(response.text)

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: "Explain the Occam's Razor concept and provide everyday examples of it",
    config: {
      thinkingConfig: {
        thinkingBudget: 1024,
      },
    },
  });

  console.log(response.text);
}

main();

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [
    {
      "parts": [
        {
          "text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
        }
      ]
    }
  ],
  "generationConfig": {
    "thinkingConfig": {
          "thinkingBudget": 1024
    }
  }
}'

Sử dụng các công cụ có mô hình tư duy

Bạn có thể kết hợp việc sử dụng các mô hình tư duy với bất kỳ công cụ và tính năng nào của Gemini để thực hiện các thao tác ngoài việc tạo văn bản. Điều này cho phép chúng tương tác với các hệ thống bên ngoài, thực thi mã hoặc truy cập thông tin theo thời gian thực, kết hợp kết quả vào quá trình suy luận và phản hồi cuối cùng.

Công cụ tìm kiếm cho phép mô hình truy vấn các công cụ tìm kiếm bên ngoài để tìm thông tin mới nhất hoặc thông tin ngoài dữ liệu huấn luyện. Điều này rất hữu ích đối với các câu hỏi về các sự kiện gần đây hoặc chủ đề rất cụ thể.
Công cụ thực thi mã cho phép mô hình tạo và chạy mã Python để thực hiện các phép tính, thao tác với dữ liệu hoặc giải quyết các vấn đề được xử lý tốt nhất theo thuật toán. Mô hình nhận được kết quả của mã và có thể sử dụng kết quả đó trong phản hồi.
Với đầu ra có cấu trúc, bạn có thể ràng buộc Gemini phản hồi bằng JSON, một định dạng đầu ra có cấu trúc phù hợp với quy trình xử lý tự động. Điều này đặc biệt hữu ích khi tích hợp đầu ra của mô hình vào các ứng dụng.
Lệnh gọi hàm kết nối mô hình suy nghĩ với các công cụ và API bên ngoài, nhờ đó có thể suy luận về thời điểm gọi hàm phù hợp và tham số cần cung cấp.

Các phương pháp hay nhất

Phần này bao gồm một số hướng dẫn để sử dụng các mô hình tư duy một cách hiệu quả. Như mọi khi, bạn sẽ đạt được kết quả tốt nhất nếu làm theo hướng dẫn và các phương pháp hay nhất về lời nhắc của chúng tôi.

Gỡ lỗi và điều hướng

Xem xét lý do: Khi bạn không nhận được câu trả lời như mong đợi từ các mô hình tư duy, bạn có thể phân tích kỹ lưỡng quá trình suy luận của Gemini. Bạn có thể xem cách trình chạy phân tích tác vụ và đưa ra kết luận, đồng thời sử dụng thông tin đó để sửa đổi nhằm đạt được kết quả chính xác.
Cung cấp hướng dẫn trong quá trình suy luận: Nếu muốn có kết quả đặc biệt dài, bạn nên đưa ra hướng dẫn trong câu lệnh để hạn chế khả năng suy nghĩ mà mô hình sử dụng. Điều này cho phép bạn đặt trước nhiều đầu ra mã thông báo hơn cho phản hồi của mình.

Độ phức tạp của tác vụ

Nhiệm vụ dễ dàng (Có thể tắt tính năng Tư duy): Đối với các yêu cầu đơn giản, không cần phải suy luận phức tạp, chẳng hạn như truy xuất hoặc phân loại thông tin đơn giản, không cần phải suy nghĩ. Ví dụ:
- "DeepMind được thành lập ở đâu?"
- "Email này là để mời tôi tham gia cuộc họp hay chỉ cung cấp thông tin?"
Công việc trung bình (Mặc định/Có suy nghĩ): Nhiều yêu cầu phổ biến sẽ được hưởng lợi từ mức độ xử lý từng bước hoặc hiểu biết sâu hơn. Gemini có thể linh hoạt sử dụng khả năng tư duy cho các nhiệm vụ như:
- So sánh quá trình quang hợp và quá trình lớn lên.
- So sánh và đối chiếu xe điện và xe lai.
Nhiệm vụ khó (Khả năng tư duy tối đa): Đối với những thử thách thực sự phức tạp, AI cần sử dụng toàn bộ khả năng lập luận và lập kế hoạch, thường liên quan đến nhiều bước nội bộ trước khi đưa ra câu trả lời. Ví dụ:
- Giải bài toán 1 trong AIME 2025: Tìm tổng của tất cả các cơ số số nguyên b > 9 mà 17_b là một ước số của 97_b.
- Viết mã Python cho một ứng dụng web trực quan hoá dữ liệu thị trường chứng khoán theo thời gian thực, bao gồm cả việc xác thực người dùng. Hãy làm cho quá trình này hiệu quả nhất có thể.

Tiếp theo là gì?

Dùng thử bản xem trước Gemini 2.5 Pro trong Google AI Studio.
Để biết thêm thông tin về bản dùng thử Gemini 2.5 Pro và tính năng Tư duy nhanh Gemini 2.0, hãy xem trang mô hình.
Hãy thử thêm các ví dụ trong Sổ tay tư duy.