โมเดลซีรีส์ Gemini 2.5 ใช้ "กระบวนการคิด" ภายในระหว่างการสร้างคำตอบ กระบวนการนี้ช่วยพัฒนาความสามารถในการใช้เหตุผลและช่วยให้เด็กๆ ใช้การวางแผนแบบหลายขั้นตอนเพื่อแก้ปัญหาที่ซับซ้อน ทำให้โมเดลเหล่านี้เก่งเป็นพิเศษในการเขียนโค้ด คณิตศาสตร์ขั้นสูง การวิเคราะห์ข้อมูล และงานอื่นๆ ที่ต้องอาศัยการวางแผนหรือการคิด
คู่มือนี้จะแสดงวิธีใช้ความสามารถด้านการคิดของ Gemini โดยใช้ Gemini API
ใช้รูปแบบการคิด
โมเดลที่มีความสามารถในการคิดมีให้บริการใน Google AI Studio และผ่านทาง Gemini API การคิดจะเปิดอยู่โดยค่าเริ่มต้นทั้งใน API และ AI Studio เนื่องจากโมเดลซีรีส์ 2.5 มีความสามารถในการตัดสินใจโดยอัตโนมัติว่าจะคิดเมื่อใดและคิดมากน้อยเพียงใดตามพรอมต์ สำหรับกรณีการใช้งานส่วนใหญ่
คุณควรปล่อยให้คิดต่อไป แต่หากต้องการปิดการคิด ให้ตั้งค่าพารามิเตอร์ thinkingBudget
เป็น 0
ส่งคำขอพื้นฐาน
from google import genai
client = genai.Client(api_key="GOOGLE_API_KEY")
prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example."
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents=prompt
)
print(response.text)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const prompt = "Explain the concept of Occam's Razor and provide a simple, everyday example.";
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: prompt,
});
console.log(response.text);
}
main();
// import packages here
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GOOGLE_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
model := client.GenerativeModel("gemini-2.5-flash-preview-04-17")
resp, err := model.GenerateContent(ctx, genai.Text("Explain the concept of Occam's Razor and provide a simple, everyday example."))
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.Text())
}
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the concept of Occam\''s Razor and provide a simple, everyday example."
}
]
}
]
}'
```
กำหนดงบประมาณสำหรับโมเดลการคิด
พารามิเตอร์ thinkingBudget
จะชี้แนะโมเดลเกี่ยวกับจำนวนโทเค็นการคิดที่จะใช้เมื่อสร้างคำตอบ โดยทั่วไปแล้ว โทเค็นจำนวนมากจะเชื่อมโยงกับการคิดที่มีรายละเอียดมากขึ้น ซึ่งจำเป็นสำหรับการแก้ปัญหางานที่ซับซ้อนยิ่งขึ้น thinkingBudget
ต้องเป็นจำนวนเต็มในช่วง 0 ถึง 24576 การกำหนดงบประมาณคิดเป็น 0 จะปิดใช้การคิด
โดยโมเดลอาจมีงบประมาณของโทเค็นมากเกินไปหรือน้อยเกินไป ทั้งนี้ขึ้นอยู่กับพรอมต์
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents="Explain the Occam's Razor concept and provide everyday examples of it",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_budget=1024)
),
)
print(response.text)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
async function main() {
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-preview-04-17",
contents: "Explain the Occam's Razor concept and provide everyday examples of it",
config: {
thinkingConfig: {
thinkingBudget: 1024,
},
},
});
console.log(response.text);
}
main();
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-04-17:generateContent?key=$GOOGLE_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain the Occam\''s Razor concept and provide everyday examples of it"
}
]
}
],
"generationConfig": {
"thinkingConfig": {
"thinkingBudget": 1024
}
}
}'
ใช้เครื่องมือกับรูปแบบการคิด
คุณสามารถรวมการใช้โมเดลการคิดของคุณเข้ากับเครื่องมือใดๆ ของ Gemini และความสามารถในการดำเนินการต่างๆ นอกเหนือจากการสร้างข้อความ ซึ่งช่วยให้สามารถโต้ตอบกับระบบภายนอก เรียกใช้โค้ด หรือเข้าถึงข้อมูลแบบเรียลไทม์ โดยนำผลลัพธ์ที่ได้ไปประกอบในการให้เหตุผลและคำตอบในขั้นสุดท้าย
เครื่องมือค้นหาช่วยให้โมเดลนี้สามารถสืบค้นเครื่องมือค้นหาภายนอกเพื่อค้นหาข้อมูลล่าสุดหรือข้อมูลที่นอกเหนือไปจากข้อมูลการฝึก ซึ่งมีประโยชน์สำหรับคำถามเกี่ยวกับเหตุการณ์ล่าสุดหรือ หัวข้อที่มีความเฉพาะเจาะจงสูง
เครื่องมือการเรียกใช้โค้ดช่วยให้โมเดลสร้างและเรียกใช้โค้ด Python เพื่อคำนวณ จัดการข้อมูล หรือแก้ปัญหาที่จัดการด้วยอัลกอริทึมได้ดีที่สุด โมเดลจะรับเอาต์พุตของโค้ดและนำไปใช้ในคำตอบได้
เอาต์พุตที่มีโครงสร้างช่วยให้คุณจำกัด Gemini ให้ตอบกลับด้วย JSON ซึ่งเป็นรูปแบบเอาต์พุตที่มีโครงสร้างที่เหมาะสำหรับการประมวลผลอัตโนมัติ ซึ่งมีประโยชน์อย่างยิ่งสำหรับการผสานรวมเอาต์พุตของโมเดลเข้ากับแอปพลิเคชัน
การเรียกใช้ฟังก์ชันจะเชื่อมต่อโมเดลการคิดเข้ากับเครื่องมือและ API ภายนอก ดังนั้นจึงสามารถให้เหตุผลได้ว่าควรเรียกใช้ฟังก์ชันที่เหมาะสมเมื่อใดและควรระบุพารามิเตอร์ใด
แนวทางปฏิบัติแนะนำ
ส่วนนี้ประกอบด้วยคำแนะนำบางประการในการใช้รูปแบบการคิดอย่างมีประสิทธิภาพ และเช่นเคย การปฏิบัติตามคำแนะนำและแนวทางปฏิบัติแนะนำของเราจะช่วยให้คุณได้รับผลลัพธ์ที่ดีที่สุด
การแก้ไขข้อบกพร่องและการกำหนดทิศทาง
ตรวจสอบการให้เหตุผล: เมื่อไม่ได้รับคำตอบที่ต้องการจากโมเดลการคิดแล้ว การวิเคราะห์กระบวนการให้เหตุผลของ Gemini อย่างละเอียดจะช่วยคุณได้ คุณจะเห็นวิธีที่ระบบแจกแจงรายละเอียดของงานและได้ข้อสรุป จากนั้นจึงนำข้อมูลที่ได้มาแก้ไขเพื่อให้ได้ผลลัพธ์ที่ถูกต้อง
ให้คำแนะนำในการให้เหตุผล: หากคุณต้องการผลลัพธ์ที่ยาวเป็นพิเศษ คุณอาจต้องการให้แนวทางในพรอมต์เพื่อจำกัดปริมาณการคิดที่โมเดลใช้ ซึ่งจะช่วยให้คุณจองเอาต์พุตของ โทเค็นได้มากขึ้นสำหรับการตอบกลับของคุณ
ความซับซ้อนของงาน
- งานง่ายๆ (อาจปิดใช้การคิด): สำหรับคำขอที่ตรงไปตรงมา ไม่จำเป็นต้องใช้การคิดที่ซับซ้อน เช่น การดึงข้อมูลข้อเท็จจริงหรือการจำแนกประเภทที่ตรงไปตรงมา ตัวอย่างเช่น
- "DeepMind ก่อตั้งขึ้นที่ไหน"
- "อีเมลนี้เป็นการขอนัดหมายการประชุมหรือแค่ให้ข้อมูล"
- งานขนาดกลาง (ค่าเริ่มต้น/ความคิดบางอย่าง): คำขอทั่วไปจำนวนมากจะได้รับประโยชน์จากการประมวลผลแบบทีละขั้นตอนหรือความเข้าใจที่ลึกซึ้งยิ่งขึ้น Gemini ใช้ความสามารถด้านการคิดในการทำงานต่างๆ ได้อย่างยืดหยุ่น เช่น
- เปรียบเทียบการสังเคราะห์ด้วยแสงกับการเจริญเติบโต
- เปรียบเทียบรถยนต์ไฟฟ้ากับรถยนต์ไฮบริด
- งานยาก (ความสามารถในการคิดสูงสุด): สำหรับงานที่ซับซ้อนมาก AI ต้องใช้ความสามารถในการใช้เหตุผลและวางแผนอย่างเต็มรูปแบบ ซึ่งมักจะเกี่ยวข้องกับขั้นตอนภายในหลายขั้นตอนก่อนที่จะให้คำตอบ ตัวอย่างเช่น
- แก้โจทย์ที่ 1 ใน AIME 2025: หาผลรวมของฐานจำนวนเต็มทั้งหมด b > 9 ที่ 17b คือตัวหารของ 97b
- เขียนโค้ด Python สําหรับเว็บแอปพลิเคชันที่แสดงข้อมูลตลาดหุ้นแบบเรียลไทม์ รวมถึงการตรวจสอบสิทธิ์ของผู้ใช้ ทำงานให้มีประสิทธิภาพมากที่สุด
ขั้นตอนถัดไปคือ
- ลองใช้ Gemini 2.5 Pro Preview ใน Google AI Studio
- ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemini 2.5 Pro Preview และ Gemini Flash 2.0 Thinking ได้ที่หน้าโมเดล
- ลองดูตัวอย่างเพิ่มเติมได้ในตำราอาหารที่ใช้ความคิด