กำลังคิด

โมเดลซีรีส์ Gemini 2.5 ใช้ "กระบวนการคิด" ภายในระหว่างการสร้างคำตอบ กระบวนการนี้ช่วยพัฒนาความสามารถในการใช้เหตุผลและช่วยให้เด็กๆ ใช้การวางแผนแบบหลายขั้นตอนเพื่อแก้ปัญหาที่ซับซ้อน ด้วยเหตุนี้ โมเดลเหล่านี้จึงเก่งด้านการเขียนโค้ด คณิตศาสตร์ขั้นสูง การวิเคราะห์ข้อมูล และงานอื่นๆ ที่ต้องอาศัยการวางแผนหรือการคิด

ลองใช้ Gemini 2.5 Flash Preview ใน Google AI Studio

คู่มือนี้จะแสดงวิธีใช้ความสามารถด้านการคิดของ Gemini โดยใช้ Gemini API

ใช้โมเดลการคิด

โมเดลที่มีความสามารถในการคิดมีให้บริการใน Google AI Studio และผ่าน Gemini API การคิดจะเปิดอยู่โดยค่าเริ่มต้นทั้งใน API และ AI Studio เนื่องจากโมเดลซีรีส์ 2.5 มีความสามารถในการตัดสินใจโดยอัตโนมัติว่าจะคิดเมื่อใดและคิดมากน้อยเพียงใดตามพรอมต์ ในกรณีการใช้งานส่วนใหญ่ การเปิดใช้การคิดไว้จะมีประโยชน์ แต่หากต้องการปิดการคิด ให้ตั้งค่าพารามิเตอร์ thinkingBudget เป็น 0

ส่งคำขอพื้นฐาน

PythonJavaScriptGoREST

from google import genai

client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents=prompt
)

print(response.text)

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: prompt,
  });

  console.log(response.text);
}

main();

// import packages here

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
  if err != nil {
    log.Fatal(err)
  }
  defer client.Close()

  model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
  resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
  if err != nil {
    log.Fatal(err)
  }
  fmt.Println(resp.Text())
}

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
 -H 'Content-Type: application/json' \
 -X POST \
 -d '{
   "contents": [
     {
       "parts": [
         {
           "text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
         }
       ]
     }
   ]
 }'
 ```

กำหนดงบประมาณในโมเดลการคิด

พารามิเตอร์ thinkingBudget จะให้คําแนะนําแก่โมเดลเกี่ยวกับจํานวนโทเค็นการคิดที่โมเดลสามารถใช้เมื่อสร้างคําตอบ โดยปกติแล้ว โทเค็นจํานวนมากขึ้นจะเชื่อมโยงกับการคิดอย่างละเอียดมากขึ้น ซึ่งจําเป็นสําหรับการแก้ปัญหาที่ซับซ้อนมากขึ้น thinkingBudget ต้องเป็นจำนวนเต็มในช่วง 0 ถึง 24576 การตั้งงบประมาณการคิดเป็น 0 จะปิดใช้การคิด

โมเดลอาจใช้งบประมาณโทเค็นเกินหรือต่ำกว่าที่ควรจะเป็น ทั้งนี้ขึ้นอยู่กับพรอมต์

PythonJavaScriptREST

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents="Explain the Occam's Razor concept and provide everyday examples of it",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_budget=1024)
    ),
)

print(response.text)

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: "Explain the Occam's Razor concept and provide everyday examples of it",
    config: {
      thinkingConfig: {
        thinkingBudget: 1024,
      },
    },
  });

  console.log(response.text);
}

main();

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [
    {
      "parts": [
        {
          "text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
        }
      ]
    }
  ],
  "generationConfig": {
    "thinkingConfig": {
          "thinkingBudget": 1024
    }
  }
}'

ใช้เครื่องมือกับรูปแบบการคิด

คุณสามารถใช้โมเดลการคิดร่วมกับเครื่องมือและความสามารถอื่นๆ ของ Gemini เพื่อดำเนินการนอกเหนือจากการสร้างข้อความได้ ซึ่งช่วยให้สามารถโต้ตอบกับระบบภายนอก เรียกใช้โค้ด หรือเข้าถึงข้อมูลแบบเรียลไทม์ รวมถึงนําผลลัพธ์มาใช้ในการหาเหตุผลและคำตอบสุดท้าย

เครื่องมือค้นหาช่วยให้โมเดลสามารถค้นหาข้อมูลล่าสุดหรือข้อมูลนอกเหนือจากข้อมูลที่ใช้ฝึกได้ ซึ่งมีประโยชน์สำหรับคำถามเกี่ยวกับเหตุการณ์ล่าสุดหรือหัวข้อที่เฉพาะเจาะจงมาก
เครื่องมือการเรียกใช้โค้ดช่วยให้โมเดลสร้างและเรียกใช้โค้ด Python เพื่อทําการคํานวณ จัดการข้อมูล หรือแก้ปัญหาด้วยอัลกอริทึมได้ดีที่สุด โมเดลจะรับเอาต์พุตของโค้ดและนำไปใช้ในคำตอบได้
เอาต์พุตที่มีโครงสร้างช่วยให้คุณจำกัด Gemini ให้ตอบกลับด้วย JSON ซึ่งเป็นรูปแบบเอาต์พุตที่มีโครงสร้างที่เหมาะสำหรับการประมวลผลอัตโนมัติ ซึ่งจะเป็นประโยชน์อย่างยิ่งสำหรับการผสานรวมเอาต์พุตของโมเดลเข้ากับแอปพลิเคชัน
การเรียกใช้ฟังก์ชันจะเชื่อมต่อโมเดลการคิดกับเครื่องมือและ API ภายนอก เพื่อให้สามารถหาเหตุผลว่าควรเรียกใช้ฟังก์ชันใดและระบุพารามิเตอร์ใด

แนวทางปฏิบัติแนะนำ

ส่วนนี้มีคำแนะนำบางส่วนในการใช้รูปแบบการคิดอย่างมีประสิทธิภาพ ดังเช่นเคย การทำตามคำแนะนำและแนวทางปฏิบัติแนะนำเกี่ยวกับพรอมต์จะช่วยให้คุณได้รับผลลัพธ์ที่ดีที่สุด

การแก้ไขข้อบกพร่องและการควบคุม

ตรวจสอบการหาเหตุผล: เมื่อคุณไม่ได้รับการตอบกลับตามที่คาดหวังจากโมเดลการคิด การวิเคราะห์กระบวนการหาเหตุผลของ Gemini อย่างละเอียดอาจช่วยได้ คุณสามารถดูวิธีที่ระบบแจกแจงงานและสรุปผลลัพธ์ รวมถึงใช้ข้อมูลดังกล่าวเพื่อแก้ไขให้ได้ผลลัพธ์ที่ถูกต้อง
ให้คําแนะนําในการให้เหตุผล: หากต้องการเอาต์พุตที่ยาวเป็นพิเศษ คุณอาจต้องให้คําแนะนําในพรอมต์เพื่อจำกัดปริมาณการคิดที่โมเดลใช้ ซึ่งจะช่วยให้คุณจองเอาต์พุตโทเค็นได้มากขึ้นสำหรับการตอบกลับ

ความซับซ้อนของงาน

งานง่ายๆ (อาจปิดใช้การคิด): สำหรับคำขอที่ตรงไปตรงมา ไม่จำเป็นต้องใช้การคิดที่ซับซ้อน เช่น การดึงข้อมูลข้อเท็จจริงหรือการจำแนกประเภทที่ตรงไปตรงมา ตัวอย่างเช่น
- "DeepMind ก่อตั้งขึ้นที่ไหน"
- "อีเมลนี้เป็นการขอนัดหมายการประชุมหรือแค่ให้ข้อมูล"
งานระดับปานกลาง (ค่าเริ่มต้น/มีการคิดบ้าง): คำขอทั่วไปจำนวนมากได้รับประโยชน์จากการประมวลผลแบบทีละขั้นตอนหรือการทําความเข้าใจที่ลึกซึ้งยิ่งขึ้น Gemini ใช้ความสามารถด้านการคิดในการทำงานต่างๆ ได้อย่างยืดหยุ่น เช่น
- เปรียบเทียบการสังเคราะห์แสงกับการเจริญเติบโต
- เปรียบเทียบรถยนต์ไฟฟ้ากับรถยนต์ไฮบริด
งานยาก (ความสามารถในการคิดสูงสุด): สำหรับงานที่ซับซ้อนมาก AI ต้องใช้ความสามารถในการใช้เหตุผลและวางแผนอย่างเต็มรูปแบบ ซึ่งมักจะเกี่ยวข้องกับขั้นตอนภายในหลายขั้นตอนก่อนที่จะให้คำตอบ ตัวอย่างเช่น
- แก้ปัญหาที่ 1 ใน AIME 2025: หาผลรวมของฐานจำนวนเต็มทั้งหมด b > 9 ซึ่ง 17_b เป็นตัวหารของ 97_b
- เขียนโค้ด Python สําหรับเว็บแอปพลิเคชันที่แสดงข้อมูลตลาดหุ้นแบบเรียลไทม์ รวมถึงการตรวจสอบสิทธิ์ของผู้ใช้ ทำงานให้มีประสิทธิภาพมากที่สุด

ขั้นตอนถัดไปคือ

ลองใช้ Gemini 2.5 Pro Preview ใน Google AI Studio
ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันตัวอย่างของ Gemini 2.5 Pro และ Gemini Flash 2.0 Thinking ได้ที่หน้าโมเดล
ลองดูตัวอย่างเพิ่มเติมในตำราการคิด