กำลังคิด

โมเดลซีรีส์ Gemini 2.5 ใช้ "กระบวนการคิด" ภายในระหว่างการสร้างคำตอบ กระบวนการนี้ช่วยพัฒนาความสามารถในการใช้เหตุผลและช่วยให้เด็กๆ ใช้การวางแผนแบบหลายขั้นตอนเพื่อแก้ปัญหาที่ซับซ้อน ด้วยเหตุนี้ โมเดลเหล่านี้จึงเก่งด้านการเขียนโค้ด คณิตศาสตร์ขั้นสูง การวิเคราะห์ข้อมูล และงานอื่นๆ ที่ต้องอาศัยการวางแผนหรือการคิด

คู่มือนี้จะแสดงวิธีใช้ความสามารถด้านการคิดของ Gemini โดยใช้ Gemini API

ใช้โมเดลการคิด

โมเดลที่มีความสามารถในการคิดมีให้บริการใน Google AI Studio และผ่าน Gemini API การคิดจะเปิดอยู่โดยค่าเริ่มต้นทั้งใน API และ AI Studio เนื่องจากโมเดลซีรีส์ 2.5 มีความสามารถในการตัดสินใจโดยอัตโนมัติว่าจะคิดเมื่อใดและคิดมากน้อยเพียงใดตามพรอมต์ ในกรณีการใช้งานส่วนใหญ่ การเปิดใช้การคิดไว้จะมีประโยชน์ แต่หากต้องการปิดการคิด ให้ตั้งค่าพารามิเตอร์ thinkingBudget เป็น 0

ส่งคำขอพื้นฐาน

PythonJavaScriptGoREST
from google import genai

client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents=prompt
)

print(response.text)
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: prompt,
  });

  console.log(response.text);
}

main();
// import packages here

func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
  if err != nil {
    log.Fatal(err)
  }
  defer client.Close()

  model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
  resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
  if err != nil {
    log.Fatal(err)
  }
  fmt.Println(resp.Text())
}
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
 -H 'Content-Type: application/json' \
 -X POST \
 -d '{
   "contents": [
     {
       "parts": [
         {
           "text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
         }
       ]
     }
   ]
 }'
 ```

กำหนดงบประมาณในโมเดลการคิด

พารามิเตอร์ thinkingBudget จะให้คําแนะนําแก่โมเดลเกี่ยวกับจํานวนโทเค็นการคิดที่โมเดลสามารถใช้เมื่อสร้างคําตอบ โดยปกติแล้ว โทเค็นจํานวนมากขึ้นจะเชื่อมโยงกับการคิดอย่างละเอียดมากขึ้น ซึ่งจําเป็นสําหรับการแก้ปัญหาที่ซับซ้อนมากขึ้น thinkingBudget ต้องเป็นจำนวนเต็มในช่วง 0 ถึง 24576 การตั้งงบประมาณการคิดเป็น 0 จะปิดใช้การคิด

โมเดลอาจใช้งบประมาณโทเค็นเกินหรือต่ำกว่าที่ควรจะเป็น ทั้งนี้ขึ้นอยู่กับพรอมต์

PythonJavaScriptREST
from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents="Explain the Occam's Razor concept and provide everyday examples of it",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_budget=1024)
    ),
)

print(response.text)
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-preview-04-17",
    contents: "Explain the Occam's Razor concept and provide everyday examples of it",
    config: {
      thinkingConfig: {
        thinkingBudget: 1024,
      },
    },
  });

  console.log(response.text);
}

main();
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [
    {
      "parts": [
        {
          "text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
        }
      ]
    }
  ],
  "generationConfig": {
    "thinkingConfig": {
          "thinkingBudget": 1024
    }
  }
}'

ใช้เครื่องมือกับรูปแบบการคิด

คุณสามารถใช้โมเดลการคิดร่วมกับเครื่องมือและความสามารถอื่นๆ ของ Gemini เพื่อดำเนินการนอกเหนือจากการสร้างข้อความได้ ซึ่งช่วยให้สามารถโต้ตอบกับระบบภายนอก เรียกใช้โค้ด หรือเข้าถึงข้อมูลแบบเรียลไทม์ รวมถึงนําผลลัพธ์มาใช้ในการหาเหตุผลและคำตอบสุดท้าย

  • เครื่องมือค้นหาช่วยให้โมเดลสามารถค้นหาข้อมูลล่าสุดหรือข้อมูลนอกเหนือจากข้อมูลที่ใช้ฝึกได้ ซึ่งมีประโยชน์สำหรับคำถามเกี่ยวกับเหตุการณ์ล่าสุดหรือหัวข้อที่เฉพาะเจาะจงมาก

  • เครื่องมือการเรียกใช้โค้ดช่วยให้โมเดลสร้างและเรียกใช้โค้ด Python เพื่อทําการคํานวณ จัดการข้อมูล หรือแก้ปัญหาด้วยอัลกอริทึมได้ดีที่สุด โมเดลจะรับเอาต์พุตของโค้ดและนำไปใช้ในคำตอบได้

  • เอาต์พุตที่มีโครงสร้างช่วยให้คุณจำกัด Gemini ให้ตอบกลับด้วย JSON ซึ่งเป็นรูปแบบเอาต์พุตที่มีโครงสร้างที่เหมาะสำหรับการประมวลผลอัตโนมัติ ซึ่งจะเป็นประโยชน์อย่างยิ่งสำหรับการผสานรวมเอาต์พุตของโมเดลเข้ากับแอปพลิเคชัน

  • การเรียกใช้ฟังก์ชันจะเชื่อมต่อโมเดลการคิดกับเครื่องมือและ API ภายนอก เพื่อให้สามารถหาเหตุผลว่าควรเรียกใช้ฟังก์ชันใดและระบุพารามิเตอร์ใด

แนวทางปฏิบัติแนะนำ

ส่วนนี้มีคำแนะนำบางส่วนในการใช้รูปแบบการคิดอย่างมีประสิทธิภาพ ดังเช่นเคย การทำตามคำแนะนำและแนวทางปฏิบัติแนะนำเกี่ยวกับพรอมต์จะช่วยให้คุณได้รับผลลัพธ์ที่ดีที่สุด

การแก้ไขข้อบกพร่องและการควบคุม

  • ตรวจสอบการหาเหตุผล: เมื่อคุณไม่ได้รับการตอบกลับตามที่คาดหวังจากโมเดลการคิด การวิเคราะห์กระบวนการหาเหตุผลของ Gemini อย่างละเอียดอาจช่วยได้ คุณสามารถดูวิธีที่ระบบแจกแจงงานและสรุปผลลัพธ์ รวมถึงใช้ข้อมูลดังกล่าวเพื่อแก้ไขให้ได้ผลลัพธ์ที่ถูกต้อง

  • ให้คําแนะนําในการให้เหตุผล: หากต้องการเอาต์พุตที่ยาวเป็นพิเศษ คุณอาจต้องให้คําแนะนําในพรอมต์เพื่อจำกัดปริมาณการคิดที่โมเดลใช้ ซึ่งจะช่วยให้คุณจองเอาต์พุตโทเค็นได้มากขึ้นสำหรับการตอบกลับ

ความซับซ้อนของงาน

  • งานง่ายๆ (อาจปิดใช้การคิด): สำหรับคำขอที่ตรงไปตรงมา ไม่จำเป็นต้องใช้การคิดที่ซับซ้อน เช่น การดึงข้อมูลข้อเท็จจริงหรือการจำแนกประเภทที่ตรงไปตรงมา ตัวอย่างเช่น
    • "DeepMind ก่อตั้งขึ้นที่ไหน"
    • "อีเมลนี้เป็นการขอนัดหมายการประชุมหรือแค่ให้ข้อมูล"
  • งานระดับปานกลาง (ค่าเริ่มต้น/มีการคิดบ้าง): คำขอทั่วไปจำนวนมากได้รับประโยชน์จากการประมวลผลแบบทีละขั้นตอนหรือการทําความเข้าใจที่ลึกซึ้งยิ่งขึ้น Gemini ใช้ความสามารถด้านการคิดในการทำงานต่างๆ ได้อย่างยืดหยุ่น เช่น
    • เปรียบเทียบการสังเคราะห์แสงกับการเจริญเติบโต
    • เปรียบเทียบรถยนต์ไฟฟ้ากับรถยนต์ไฮบริด
  • งานยาก (ความสามารถในการคิดสูงสุด): สำหรับงานที่ซับซ้อนมาก AI ต้องใช้ความสามารถในการใช้เหตุผลและวางแผนอย่างเต็มรูปแบบ ซึ่งมักจะเกี่ยวข้องกับขั้นตอนภายในหลายขั้นตอนก่อนที่จะให้คำตอบ ตัวอย่างเช่น
    • แก้ปัญหาที่ 1 ใน AIME 2025: หาผลรวมของฐานจำนวนเต็มทั้งหมด b > 9 ซึ่ง 17b เป็นตัวหารของ 97b
    • เขียนโค้ด Python สําหรับเว็บแอปพลิเคชันที่แสดงข้อมูลตลาดหุ้นแบบเรียลไทม์ รวมถึงการตรวจสอบสิทธิ์ของผู้ใช้ ทำงานให้มีประสิทธิภาพมากที่สุด

ขั้นตอนถัดไปคือ

  • ลองใช้ Gemini 2.5 Pro Preview ใน Google AI Studio
  • ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันตัวอย่างของ Gemini 2.5 Pro และ Gemini Flash 2.0 Thinking ได้ที่หน้าโมเดล
  • ลองดูตัวอย่างเพิ่มเติมในตำราการคิด