มีอะไรใหม่ใน Gemini 3.5 Flash
Gemini 3.5 Flash พร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) มีความเสถียร และพร้อมสำหรับการใช้งานจริงในวงกว้าง โมเดล Flash ที่ชาญฉลาดที่สุดของเรามอบประสิทธิภาพระดับแนวหน้าอย่างต่อเนื่องในด้านการดำเนินการแบบเป็น Agent การเขียนโค้ด และงานระยะยาวที่ปรับขนาดได้
คำแนะนำนี้มีภาพรวมของการปรับปรุง การเปลี่ยนแปลง API และคำแนะนำในการย้ายข้อมูลสำหรับ Gemini 3.5 Flash
โมเดลใหม่
| รุ่น | รหัสโมเดล | คำอธิบาย |
|---|---|---|
| Gemini 3.5 Flash | gemini-3.5-flash |
โมเดลที่ชาญฉลาดที่สุดของเราเพื่อประสิทธิภาพระดับแนวหน้าอย่างต่อเนื่องในงานแบบเป็น Agent และการเขียนโค้ด |
Gemini 3.5 Flash รองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็น, โทเค็นเอาต์พุตสูงสุด 65,000 โทเค็น การคิด รวมถึงชุดเครื่องมือและฟีเจอร์แพลตฟอร์มเดียวกันกับ Gemini 3 Flash ขณะนี้ระบบยังไม่รองรับการใช้คอมพิวเตอร์
ดูรายละเอียดทั้งหมดได้ที่ภาพรวมของโมเดล โปรดดูราคาในหน้าราคา
คู่มือเริ่มใช้งานฉบับย่อ
ตัวอย่างทั้งหมดในคู่มือนี้ใช้ GenerateContent API นอกจากนี้ยังรองรับ API การโต้ตอบด้วย โดยจะใช้ตัวเลือกการกำหนดค่าและคำแนะนำเดียวกัน
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Explain how parallel agentic execution works in three sentences.",
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Explain how parallel agentic execution works in three sentences.",
});
console.log(response.text);
}
main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts": [{"text": "Explain how parallel agentic execution works in three sentences."}]
}]
}'
มีอะไรใหม่
- ประสิทธิภาพระดับแนวหน้าอย่างต่อเนื่อง: โมเดล Flash ที่ชาญฉลาดที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานด้าน Agentic AI และการเขียนโค้ดที่ปรับขนาดได้
- การดำเนินการของ Agent: การติดตั้งใช้งาน Agent ย่อย การแก้ปัญหา และลูปของ Agent ที่รวดเร็วที่ปรับขนาดได้
- การเขียนโค้ด: วงจรการเขียนโค้ดแบบวนซ้ำ การสำรวจอย่างรวดเร็ว และการสร้างต้นแบบเพื่อ ทดสอบเส้นทางอื่นและสำรวจโซลูชันแบบไดนามิก
- ระยะยาว: เวิร์กโฟลว์แบบหลายขั้นตอนและการใช้เครื่องมือในวงกว้าง
- การคงความคิด: โมเดลจะคงการให้เหตุผลระดับกลางในการสนทนาหลายรอบโดยอัตโนมัติ ไม่ต้องเปลี่ยนแปลง API
- ระดับความพยายามเริ่มต้นใหม่: เปลี่ยนความพยายามในการคิดเริ่มต้นจาก
highเป็นmediumดูรายละเอียดได้ที่ระดับความพยายามเริ่มต้นใหม่ lowการคิดที่ดียิ่งขึ้น:ตอนนี้lowได้รับการปรับปรุงอย่างมากสำหรับโค้ด และงานที่ต้องใช้เอเจนต์ซึ่งมีขั้นตอนน้อยลง โดยมีคุณภาพสูงขึ้น พร้อมเวลาในการตอบสนองและต้นทุนที่ต่ำลง- การเปิดตัว GA: โมเดลเสถียรสำหรับการใช้งานจริงที่ปรับขนาดได้
การเลือกรุ่น Flash ที่เหมาะสม
Gemini 3.5 Flash เป็นโมเดล Flash ที่ชาญฉลาดและมากความสามารถที่สุดของเรา อย่างไรก็ตาม Use Case ที่แตกต่างกันอาจมีข้อกำหนดด้านต้นทุนและเวลาในการตอบสนองที่แตกต่างกัน
- Gemini 3.1 Flash-Lite: สำหรับงานที่มีปริมาณมากและมีต้นทุนต่ำ ซึ่งไม่จำเป็นต้องใช้ความสามารถในการให้เหตุผลขั้นสูงของ 3.5 Flash เราขอแนะนำให้ใช้ Gemini 3.1 Flash-Lite ซึ่งเป็นโมเดลระยะยาวที่เสถียรและได้รับการเพิ่มประสิทธิภาพเพื่อประสิทธิภาพ ดูรายละเอียดเพิ่มเติมได้ในคู่มือนักพัฒนา Flash Lite
- Gemini 3 Flash เวอร์ชันตัวอย่าง: แม้ว่าเราจะแนะนำให้ย้ายข้อมูลไปยัง 3.5 Flash เพื่อความเสถียรของ GA และการให้เหตุผลที่ดียิ่งขึ้น แต่Gemini 3 Flash (เวอร์ชันตัวอย่าง) จะยังคงพร้อมให้บริการสำหรับนักพัฒนาซอฟต์แวร์ที่ต้องการทดสอบกับโมเดลเวอร์ชันตัวอย่างต่อไป
การเปลี่ยนแปลงพฤติกรรม
ระดับความพยายามเริ่มต้นใหม่: medium
ตอนนี้ความพยายามในการคิดเริ่มต้นคือ medium ซึ่งเปลี่ยนจาก high ใน Gemini 3
Flash เวอร์ชันตัวอย่าง medium ให้ผลลัพธ์ที่ดีมากในงานที่หลากหลาย
พร้อมทั้งรวดเร็วและคุ้มค่ากว่า สำหรับปัญหาที่ซับซ้อน high
จะกระตุ้นให้โมเดลคิดอย่างลึกซึ้งยิ่งขึ้น
| ระดับความพยายาม | กรณีที่ควรใช้ |
|---|---|
minimal |
เพิ่มประสิทธิภาพเพื่อความเร็วในการตอบสนอง กรณีการใช้งานคล้ายแชท คำตอบข้อเท็จจริงแบบรวดเร็ว การเรียกใช้เครื่องมือที่ง่ายขึ้น |
low |
งานที่ต้องใช้โค้ดและงานที่ต้องใช้เอเจนต์ซึ่งต้องมีเวลาในการตอบสนองที่ต่ำกว่าและมีขั้นตอนน้อยกว่า นอกจากนี้ยังเหมาะสำหรับงานวิเคราะห์และงานเขียนที่ต้องใช้ความคิด |
medium (ค่าเริ่มต้น) |
คุณภาพดีที่สุดสำหรับงานส่วนใหญ่ แนะนำสำหรับโค้ดที่ซับซ้อนและกรณีการใช้งานแบบเอเจนต์ |
high |
เพิ่มความสามารถของโมเดลในการคิดและใช้เครื่องมือให้สูงสุด เหมาะที่สุดสำหรับการให้เหตุผลที่ซับซ้อน คณิตศาสตร์ที่ยาก และงานโค้ดหรือเอเจนต์ที่ยากที่สุด อนุญาตให้แสดงความคิดที่ยาวขึ้นและเรียกใช้ฟังก์ชัน |
หากต้องการลบล้างค่าเริ่มต้น ให้ตั้งค่า thinking_level ในการกำหนดค่า ดังนี้
Python
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Prove that the square root of 2 is irrational.",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_level="high")
),
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Prove that the square root of 2 is irrational.",
config: {
thinkingConfig: {
thinkingLevel: "HIGH",
},
},
});
console.log(response.text);
}
main();
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [{
"parts": [{"text": "Prove that the square root of 2 is irrational."}]
}],
"generationConfig": {
"thinkingConfig": {
"thinkingLevel": "HIGH"
}
}
}'
ตารางต่อไปนี้แสดงระดับการคิดที่โมเดลแต่ละรายการรองรับ
| ระดับการคิด | Gemini 3.5 Flash | Gemini 3.1 Pro | Gemini 3.1 Flash-Lite | Gemini 3 Flash | คำอธิบาย |
|---|---|---|---|---|---|
minimal |
สิ่งที่ทำได้ | สิ่งที่ทำไม่ได้ | รองรับ (ค่าเริ่มต้น) | สิ่งที่ทำได้ | ตรงกับการตั้งค่า "ไม่ต้องคิด" สำหรับคำค้นหาส่วนใหญ่ โปรดทราบว่า minimal ไม่รับประกันว่าการคิดจะปิดอยู่ โมเดลอาจให้เหตุผลน้อยมากสำหรับงานที่ซับซ้อน |
low |
สิ่งที่ทำได้ | สิ่งที่ทำได้ | สิ่งที่ทำได้ | สิ่งที่ทำได้ | ลดเวลาในการตอบสนองและค่าใช้จ่าย |
medium |
รองรับ (ค่าเริ่มต้น) | สิ่งที่ทำได้ | สิ่งที่ทำได้ | สิ่งที่ทำได้ | การคิดแบบสมดุลสำหรับงานส่วนใหญ่ |
high |
รองรับ (ไดนามิก) | รองรับ (ค่าเริ่มต้น, ไดนามิก) | รองรับ (ไดนามิก) | รองรับ (ค่าเริ่มต้น, ไดนามิก) | เพิ่มความลึกในการให้เหตุผลสูงสุด |
การเก็บรักษาความคิด
โมเดลจะคงการให้เหตุผลระดับกลางในการสนทนาแบบหลายรอบ โดยอัตโนมัติ เมื่อมีอยู่ในประวัติการสนทนา บริบทการให้เหตุผล จะส่งต่อ ซึ่งช่วยปรับปรุงประสิทธิภาพในงานที่ซับซ้อนแบบหลายขั้นตอน เช่น การแก้ไขข้อบกพร่องแบบวนซ้ำและการปรับโครงสร้างโค้ด ไม่ต้องเปลี่ยนแปลง API
- API การโต้ตอบ: ระบบจะเก็บความคิดเห็นไว้โดยอัตโนมัติอยู่แล้ว ไม่มี การเปลี่ยนแปลงลักษณะการทำงาน
- GenerateContent API: ตั้งแต่ Gemini 3.5 Flash เป็นต้นไป โมเดลจะใช้
บริบทการให้เหตุผลจากทุกช่วงก่อนหน้าเมื่อมีลายเซ็นความคิด
ในประวัติการสนทนา หากต้องการเปิดใช้ ให้ส่งประวัติการสนทนาแบบเต็ม
ที่ไม่มีการแก้ไข (รวมถึงลายเซ็นความคิด) ใน
contentsSDK จะจัดการเรื่องนี้โดยอัตโนมัติ
การอัปเดตพารามิเตอร์และแนวทางปฏิบัติแนะนำใน Gemini 3.x
ข้อกำหนดต่อไปนี้มีผลกับโมเดล Gemini 3.x ทั้งหมด ซึ่งรวมถึง Gemini 3.5 Flash
temperature,top_p,top_k: เราขอแนะนำอย่างยิ่งว่าไม่ควรเปลี่ยน ค่าเริ่มต้น ความสามารถในการให้เหตุผลของ Gemini 3 ได้รับการเพิ่มประสิทธิภาพสำหรับการ ตั้งค่าเริ่มต้น- ให้ใช้
thinking_levelแทนthinking_budget - การจับคู่การตอบกลับการเรียกฟังก์ชัน:
id,nameและจำนวนการตอบกลับ ต้องตรงกับการเรียกก่อนหน้า - การตอบกลับฟังก์ชันมัลติโมดอล: ใส่เนื้อหามัลติโมดอลไว้ภายใน การตอบกลับฟังก์ชัน ไม่ใช่นอกการตอบกลับ
- วิธีการในบรรทัดในการตอบกลับฟังก์ชัน: ต่อท้ายข้อความการตอบกลับฟังก์ชัน ไม่ใช่เป็นส่วนแยกต่างหาก
- ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น: ใช้ระดับการคิดที่ต่ำลงหรือทดลอง กับคำสั่งของระบบเพื่อลดการเรียกใช้เครื่องมือในเวิร์กโฟลว์ของเอเจนต์
ดูวิธีอัปเดตโค้ดได้ในส่วนต่างๆ ด้านล่าง
พารามิเตอร์การสุ่มตัวอย่าง (ไม่แนะนําอีกต่อไป)
เราไม่แนะนำให้ใช้ temperature, top_p และ top_k กับโมเดล Gemini
3.x ทั้งหมดอีกต่อไป ความสามารถในการให้เหตุผลของ Gemini 3 ได้รับการเพิ่มประสิทธิภาพสำหรับการตั้งค่าเริ่มต้น
นำพารามิเตอร์เหล่านี้ออกจากคำขอทั้งหมด
# ⚠️ Remove these parameters (not recommended)
config = types.GenerateContentConfig(
temperature=0.7,
top_p=0.9,
top_k=40
)
เราขอแนะนำให้กำหนดคำสั่งของระบบด้วยกฎที่ชัดเจนสำหรับกรณีการใช้งานเฉพาะของคุณเพื่อให้มั่นใจถึงความแน่นอน
thinking_budget (ไม่แนะนำอีกต่อไป)
เราไม่แนะนำให้ใช้พารามิเตอร์ตัวเลขดิบ thinking_budget ในโมเดล Gemini 3.x ทั้งหมดอีกต่อไป
ให้ใช้สตริง Enum thinking_level แทน
# ⚠️ Before (not recommended)
config = types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_budget=7500)
)
# ✅ After
config = types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(thinking_level="medium")
)
ค่าที่ใช้ได้: minimal, low, medium (ค่าเริ่มต้น) และ high
การเรียกใช้ฟังก์ชัน: การจับคู่คำตอบที่เข้มงวด
ปัจจุบัน Interactions API จะแสดงข้อผิดพลาดเมื่อการตอบกลับฟังก์ชันไม่ตรงกัน API GenerateContent ยังไม่แสดงข้อผิดพลาด แต่การตอบกลับที่ไม่ตรงกันจะทำให้โมเดล
แสดงการตอบกลับที่ว่างเปล่าพร้อม finish_reason: STOP ในกรณีส่วนใหญ่ โปรด
ทำตามรูปแบบต่อไปนี้เสมอ
| ข้อกำหนด | รายละเอียด |
|---|---|
รวม id |
FunctionResponse ทุกรายการต้องมี id จาก FunctionCall ที่เกี่ยวข้อง |
แมตช์ที่ name |
name ในการตอบกลับต้องตรงกับ name ในการเรียก |
| จำนวนการจับคู่ที่ตรงกัน | ส่งคืน FunctionResponse 1 รายการสำหรับ FunctionCall แต่ละรายการที่ได้รับ |
Python
# ✅ Include matching id and name in the function response
final_response = client.models.generate_content(
model="gemini-3.5-flash",
config=config,
contents=[
*previous_contents,
response.candidates[0].content,
types.Content(role="user", parts=[
types.Part.from_function_response(
name=tool_call.name,
response={"result": result},
id=tool_call.id,
)
]),
],
)
JavaScript
// ✅ Include matching id and name in the function response
const functionResponsePart = {
functionResponse: {
name: toolCall.name,
response: { result: result },
id: toolCall.id,
},
};
const finalResponse = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: [
...previousContents,
{ role: "model", parts: [{ functionCall: toolCall }] },
{ role: "user", parts: [functionResponsePart] },
],
config: config,
});
REST
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{"role": "user", "parts": [{"text": "..."}]},
{"role": "model", "parts": [{"functionCall": {"name": "my_function", "args": {...}}}]},
{"role": "user", "parts": [{"functionResponse": {"name": "my_function", "id": "call_id", "response": {"result": "..."}}}]}
]
}'
คำตอบของฟังก์ชันมัลติโมดัล
เรามักเห็นลูกค้าให้รูปภาพนอกการตอบกลับฟังก์ชัน ซึ่งอาจทำให้โมเดลทํางานอย่างไม่คาดคิด (เช่น การรั่วไหลของความคิด) และส่งผลให้เอาต์พุตมีคุณภาพต่ำลง โปรดทำตามคำแนะนำในเอกสารประกอบเกี่ยวกับ Multimodal Function Responses API แทน และรวมเนื้อหามัลติโมดัลไว้ในส่วนการตอบกลับฟังก์ชันที่คุณส่งไปยังโมเดล โมเดลสามารถประมวลผลเนื้อหามัลติโมดัลนี้ในรอบถัดไป เพื่อสร้างคำตอบที่รอบรู้มากขึ้น
Python
# ✅ Include multimodal content in the function response
final_response = client.models.generate_content(
model="gemini-3.5-flash",
config=config,
contents=[
*previous_contents,
response.candidates[0].content,
types.Content(role="user", parts=[
types.Part.from_function_response(
name=tool_call.name,
response={
"result": "instrument.jpg",
"image": base64_image_data,
},
id=tool_call.id,
)
]),
],
)
JavaScript
// ✅ Include multimodal content in the function response
const finalResponse = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: [
...previousContents,
{ role: "model", parts: [{ functionCall: toolCall }] },
{
role: "user",
parts: [{
functionResponse: {
name: toolCall.name,
id: toolCall.id,
response: {
result: "instrument.jpg",
image: base64ImageData,
},
},
}],
},
],
config: config,
});
คำสั่งในบรรทัดในคำตอบของฟังก์ชัน
เรามักเห็นลูกค้าให้คำสั่งเพิ่มเติมพร้อมกับการตอบกลับฟังก์ชัน
เป็นPartsในภายหลัง ซึ่งอาจทำให้โมเดลทำงานโดยไม่คาดคิด (เช่น การรั่วไหลของความคิด) และส่งผลให้เอาต์พุตมีคุณภาพต่ำลง แต่ให้ต่อท้ายคำสั่งเพิ่มเติม
ไว้ที่ท้ายข้อความคำตอบของฟังก์ชันโดยคั่นด้วยบรรทัดใหม่ 2 บรรทัด
Python
# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"
final_response = client.models.generate_content(
model="gemini-3.5-flash",
config=config,
contents=[
*previous_contents,
response.candidates[0].content,
types.Content(role="user", parts=[
types.Part.from_function_response(
name=tool_call.name,
response={"result": result_text},
id=tool_call.id,
)
]),
],
)
JavaScript
// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;
const finalResponse = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: [
...previousContents,
{ role: "model", parts: [{ functionCall: toolCall }] },
{
role: "user",
parts: [{
functionResponse: {
name: toolCall.name,
id: toolCall.id,
response: { result: resultText },
},
}],
},
],
config: config,
});
ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น
หากพบว่ามีการเรียกใช้เครื่องมือมากเกินไป เทคนิค 2 อย่างต่อไปนี้จะช่วยลดการเรียกใช้เครื่องมือได้
เริ่มต้นด้วยการลดระดับการคิด (
medium,lowหรือminimal) ระดับการคิดที่สูงขึ้นจะกระตุ้นให้โมเดลใช้เครื่องมือมากขึ้นเพื่อสำรวจและ ยืนยัน ดังนั้นการลดระดับจึงช่วยลดการเรียกใช้เครื่องมือได้เพิ่มคำสั่งของระบบ: หากยังคงมีการใช้งานมากเกินไปหลังจากปรับ ระดับการคิดแล้ว ให้ลองใช้พรอมต์ที่จำกัดการใช้เครื่องมือ เช่น
You have a limited action budget of <n> tool calls. Use them efficiently.
รายการตรวจสอบการย้ายข้อมูล
ย้ายข้อมูลจาก Gemini 3 Flash (เวอร์ชันตัวอย่าง)
- อัปเดตชื่อโมเดล:
gemini-3-flash-preview→gemini-3.5-flash - ตรวจสอบราคา Gemini 3.5 Flash มีราคาสูงกว่า Gemini 3 Flash เวอร์ชันตัวอย่าง หากกรณีการใช้งานของคุณมีความไวต่อต้นทุนสูง ให้พิจารณาย้ายข้อมูลไปใช้ Gemini 3.1 Flash-Lite แทน ดูรายละเอียดได้ที่หน้าการกำหนดราคา
- นำ
temperature,top_p,top_kออกจากไฟล์กำหนดค่า (ไม่แนะนำอีกต่อไป) - แทนที่
thinking_budgetด้วยthinking_level - เพิ่ม
idและnameที่ตรงกันลงในชิ้นส่วนFunctionResponseทั้งหมด - ทดสอบพรอมต์ เปลี่ยนความพยายามเริ่มต้นจาก
high→medium; ตรวจสอบ คุณภาพ ความเร็ว และต้นทุน - ตอนนี้ระบบจะเปิดใช้การรักษาความคิดโดยค่าเริ่มต้น บริบทการให้เหตุผลจะคงอยู่ ในแต่ละรอบ ซึ่งจะช่วยปรับปรุงประสิทธิภาพ แต่ก็อาจเพิ่มการใช้โทเค็น
- ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น: เริ่มด้วยการลดระดับการคิด
(
medium,lowหรือminimal) เพิ่มคำสั่งของระบบเพื่อจำกัดเครื่องมือ หากยังมีการใช้งานมากเกินไป - Gemini 3.5 Flash ยังไม่รองรับการใช้งานคอมพิวเตอร์ในขณะนี้ สำหรับเวิร์กโหลดการใช้งานคอมพิวเตอร์ ให้ใช้ Gemini 3 Flash Preview ต่อไป
ย้ายข้อมูลจาก Gemini 2.5
ทั้งหมดที่กล่าวมา รวมถึง
- ทำให้พรอมต์ง่ายขึ้น หากคุณใช้วิศวกรรมพรอมต์ (Prompt Engineering) แบบเชนออฟธ็อตเพื่อบังคับให้มีการให้เหตุผล ให้ลองใช้
thinking_level: "medium"หรือ"high"กับพรอมต์ที่เรียบง่ายกว่าแทน - ทดสอบปริมาณงาน PDF และสื่อ หากคุณอาศัยลักษณะการทำงานที่เฉพาะเจาะจงสำหรับการแยกวิเคราะห์เอกสารแบบหนาแน่น ให้ทดสอบการตั้งค่า
media_resolution_highเพื่อให้มั่นใจว่ายังคงมีความแม่นยำต่อไป การย้ายข้อมูลไปยังค่าเริ่มต้นของ Gemini 3 อาจเพิ่มการใช้โทเค็น สำหรับ PDF แต่ลดการใช้โทเค็นสำหรับวิดีโอ หากคำขอเกินหน้าต่างบริบท ให้ลดmedia_resolutionอย่างชัดเจน ดูรายละเอียดได้ในเอกสารประกอบเกี่ยวกับความละเอียดของสื่อ - ใช้ประโยชน์จากการใช้เครื่องมือร่วมกัน คุณใช้ Google Search, บริบท URL, การเรียกใช้โค้ด และฟังก์ชันที่กำหนดเองได้ ในคำขอเดียวกัน
- หากใช้การตอบกลับฟังก์ชันแบบมัลติโมดัล ให้ย้ายเนื้อหาแบบมัลติโมดัลไปไว้ใน ส่วนการตอบกลับฟังก์ชัน ไม่ใช่ข้างๆ
- หากใช้คำสั่งในบรรทัดกับคำตอบของฟังก์ชัน ให้ต่อท้ายคำสั่งเหล่านั้นกับข้อความคำตอบของฟังก์ชันโดยคั่นด้วยบรรทัดใหม่ 2 บรรทัด ไม่ใช่เป็นส่วนแยกต่างหาก
- Gemini 3.x ไม่รองรับการแบ่งกลุ่มรูปภาพ สำหรับเวิร์กโหลดการแบ่งกลุ่ม ให้ใช้ Gemini 2.5 Flash ต่อโดยปิดการคิด หรือใช้ Gemini Robotics-ER 1.6
ฟีเจอร์ของตระกูล Gemini 3
Gemini 3.5 Flash จะรับช่วงความสามารถทั้งหมดของตระกูล Gemini 3 ยกเว้นการใช้คอมพิวเตอร์ ฟีเจอร์ที่เปิดตัวใน Gemini 3 และจะยังคงมีต่อไป
- การคิด: บริบทการให้เหตุผลที่เข้ารหัสจะยังคงอยู่ในการเรียก API อัตโนมัติใน Interactions API และโดยนัยใน GenerateContent
- เอาต์พุตที่มีโครงสร้างพร้อมเครื่องมือ: รวมโหมด JSON กับ เครื่องมือในตัว (การค้นหา, บริบท URL, การดำเนินการโค้ด, การเรียกใช้ฟังก์ชัน)
- การตอบกลับฟังก์ชันหลายรูปแบบ: แสดง รูปภาพ เสียง และสื่ออื่นๆ ในผลการเรียกใช้ฟังก์ชัน
- การดำเนินการโค้ดด้วยรูปภาพ: ดำเนินการโค้ดที่ ประมวลผลและสร้างรูปภาพ
- การใช้เครื่องมือร่วมกัน: ใช้เครื่องมือในตัวและการเรียกใช้ฟังก์ชันที่กำหนดเองในคำขอเดียวกัน
- ความละเอียดของสื่อ:
การควบคุมการจัดสรรโทเค็นอย่างละเอียดสำหรับอินพุตรูปภาพ วิดีโอ และ PDF
โมเดล Gemini 3 รองรับการตั้งค่าความละเอียดต่อรายการเนื้อหา (
low,medium,high,ultra_high) สำหรับพรอมต์ที่มีความเที่ยงตรงแบบผสม - ลายเซ็นความคิด: การแสดงการให้เหตุผลภายในของโมเดลที่เข้ารหัส ต้องระบุสำหรับการเรียกใช้ฟังก์ชันแบบหลายรอบ ซึ่ง SDK อย่างเป็นทางการจะจัดการโดยอัตโนมัติ
แนวทางปฏิบัติแนะนำในการเขียนพรอมต์
โมเดล Gemini 3.x เป็นโมเดลการให้เหตุผล ซึ่งจะเปลี่ยนวิธีที่คุณควรใช้พรอมต์
- คำสั่งที่แม่นยำ: ใช้คำสั่งที่กระชับ Gemini 3.x ตอบสนองต่อคำสั่งที่ชัดเจนและตรงไปตรงมาได้ดีที่สุด เทคนิควิศวกรรมพรอมต์ที่ซับซ้อนหรือมีรายละเอียดมากเกินไปซึ่งออกแบบมา สำหรับโมเดลรุ่นเก่าอาจทำให้โมเดลวิเคราะห์มากเกินไป
- ความละเอียดของเอาต์พุต: โดยค่าเริ่มต้น Gemini 3.x จะมีรายละเอียดน้อยกว่าและชอบคำตอบที่ตรงไปตรงมาและมีประสิทธิภาพ หาก Use Case ของคุณต้องใช้ภาษาที่เป็นกันเอง ให้ชี้นำโมเดลอย่างชัดเจนในพรอมต์ (เช่น "อธิบายสิ่งนี้ในฐานะ ผู้ช่วยที่เป็นมิตรและช่างพูด")
- การจัดการบริบท: เมื่อทำงานกับชุดข้อมูลขนาดใหญ่ (เช่น หนังสือทั้งเล่ม ฐานโค้ด หรือวิดีโอยาว) ให้วางคำสั่งหรือคำถามที่เฉพาะเจาะจงไว้ท้ายพรอมต์หลังจากบริบทของข้อมูล ยึดตรรกะของโมเดลโดยเริ่มคำถามด้วยวลี เช่น "จากข้อมูลก่อนหน้า..."
ดูข้อมูลเพิ่มเติมเกี่ยวกับกลยุทธ์การออกแบบพรอมต์ได้ในคู่มือวิศวกรรมพรอมต์ (Prompt Engineering)
ข้อจำกัด
- Gemini 3.x ไม่รองรับการแบ่งกลุ่มรูปภาพ สำหรับเวิร์กโหลดการแบ่งกลุ่ม ให้ใช้ Gemini 2.5 Flash ต่อโดยปิดการคิด หรือใช้ Gemini Robotics-ER 1.6
คำถามที่พบบ่อย
ข้อมูลล่าสุดของ Gemini 3.5 Flash คือเมื่อใด Gemini 3.5 Flash มีการตัดข้อมูลความรู้ ณ เดือนมกราคม 2025 ดูข้อมูลล่าสุดได้ที่เครื่องมือการอ้างอิงการค้นหา
ขีดจำกัดของหน้าต่างบริบทคืออะไร Gemini 3.5 Flash รองรับหน้าต่างบริบทของอินพุตขนาด 1 ล้านโทเค็นและโทเค็นเอาต์พุตสูงสุด 65,000 โทเค็น
โค้ด
thinking_budgetเก่าของฉันจะยังใช้งานได้ไหม ได้thinking_budgetยังคงรองรับการทำงานร่วมกับเวอร์ชันก่อนหน้า แต่เราขอแนะนำให้ย้ายข้อมูลไปยังthinking_levelเพื่อให้ได้ประสิทธิภาพที่คาดการณ์ได้มากขึ้น แต่อย่าใช้ทั้ง 2 อย่างในคำขอเดียวกันGemini 3.5 Flash รองรับ Batch API ไหม ได้ ดูรายละเอียดได้ที่คู่มือ Batch API
ระบบรองรับการแคชบริบทไหม ได้ ระบบรองรับการแคชบริบท
เครื่องมือใดบ้างที่รองรับ Gemini 3.5 Flash รองรับ Google Search การอ้างอิงจาก Google Maps การค้นหาไฟล์ การเรียกใช้โค้ด บริบท URL และ การเรียกใช้ฟังก์ชันมาตรฐาน รวมถึง การใช้เครื่องมือร่วมกัน การใช้คอมพิวเตอร์ไม่รองรับ ใน Gemini 3.5 Flash
ขั้นตอนถัดไป
- ดูข้อมูลเพิ่มเติมเกี่ยวกับกลยุทธ์การออกแบบพรอมต์ได้ในคู่มือวิศวกรรมพรอมต์ (Prompt Engineering)
- เริ่มต้นใช้งาน Gemini 3 Cookbook
- ดูข้อมูลเกี่ยวกับการเพิ่มประสิทธิภาพและการอนุมานของ Gemini API