Gemini Deep Research พร้อมให้บริการในเวอร์ชันพรีวิวแล้วตอนนี้ โดยมีฟีเจอร์การวางแผนร่วมกัน การแสดงภาพข้อมูล การรองรับ MCP และอื่นๆ

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

มีอะไรใหม่ใน Gemini 3.5 Flash

หมายเหตุ: คุณกำลังดูหน้านี้ในเวอร์ชัน generateContent สําหรับโปรเจ็กต์ใหม่ เราขอแนะนําให้ใช้ Interactions API (เบต้า) ใหม่ ซึ่งสร้างขึ้นสําหรับเวิร์กโฟลว์ของเอเจนต์ งานที่ทํางานในเบื้องหลัง และความสามารถของ Gemini ในอนาคต

Gemini 3.5 Flash พร้อมให้บริการแก่ผู้ใช้ทั่วไป (GA) มีความเสถียร และพร้อมสำหรับการใช้งานจริงในวงกว้าง โมเดล Flash ที่ชาญฉลาดที่สุดของเรามอบประสิทธิภาพระดับแนวหน้าอย่างต่อเนื่องในด้านการดำเนินการแบบเป็น Agent การเขียนโค้ด และงานระยะยาวที่ปรับขนาดได้

คำแนะนำนี้มีภาพรวมของการปรับปรุง การเปลี่ยนแปลง API และคำแนะนำในการย้ายข้อมูลสำหรับ Gemini 3.5 Flash

โมเดลใหม่

รุ่น	รหัสโมเดล	คำอธิบาย
Gemini 3.5 Flash	`gemini-3.5-flash`	โมเดลที่ชาญฉลาดที่สุดของเราเพื่อประสิทธิภาพระดับแนวหน้าอย่างต่อเนื่องในงานแบบเป็น Agent และการเขียนโค้ด

Gemini 3.5 Flash รองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็น, โทเค็นเอาต์พุตสูงสุด 65,000 โทเค็น การคิด รวมถึงชุดเครื่องมือและฟีเจอร์แพลตฟอร์มเดียวกันกับ Gemini 3 Flash ขณะนี้ระบบยังไม่รองรับการใช้คอมพิวเตอร์

ดูรายละเอียดทั้งหมดได้ที่ภาพรวมของโมเดล โปรดดูราคาในหน้าราคา

คู่มือเริ่มใช้งานฉบับย่อ

ตัวอย่างทั้งหมดในคู่มือนี้ใช้ GenerateContent API นอกจากนี้ยังรองรับ API การโต้ตอบด้วย โดยจะใช้ตัวเลือกการกำหนดค่าและคำแนะนำเดียวกัน

Python

from google import genai

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
)
print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Explain how parallel agentic execution works in three sentences.",
  });
  console.log(response.text);
}

main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Explain how parallel agentic execution works in three sentences."}]
    }]
  }'

มีอะไรใหม่

ประสิทธิภาพระดับแนวหน้าอย่างต่อเนื่อง: โมเดล Flash ที่ชาญฉลาดที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานด้าน Agentic AI และการเขียนโค้ดที่ปรับขนาดได้
การดำเนินการของ Agent: การติดตั้งใช้งาน Agent ย่อย การแก้ปัญหา และลูปของ Agent ที่รวดเร็วที่ปรับขนาดได้
การเขียนโค้ด: วงจรการเขียนโค้ดแบบวนซ้ำ การสำรวจอย่างรวดเร็ว และการสร้างต้นแบบเพื่อ ทดสอบเส้นทางอื่นและสำรวจโซลูชันแบบไดนามิก
ระยะยาว: เวิร์กโฟลว์แบบหลายขั้นตอนและการใช้เครื่องมือในวงกว้าง
การคงความคิด: โมเดลจะคงการให้เหตุผลระดับกลางในการสนทนาหลายรอบโดยอัตโนมัติ ไม่ต้องเปลี่ยนแปลง API
ระดับความพยายามเริ่มต้นใหม่: เปลี่ยนความพยายามในการคิดเริ่มต้นจาก high เป็น medium ดูรายละเอียดได้ที่ระดับความพยายามเริ่มต้นใหม่
lowการคิดที่ดียิ่งขึ้น:ตอนนี้ low ได้รับการปรับปรุงอย่างมากสำหรับโค้ด และงานที่ต้องใช้เอเจนต์ซึ่งมีขั้นตอนน้อยลง โดยมีคุณภาพสูงขึ้น พร้อมเวลาในการตอบสนองและต้นทุนที่ต่ำลง
การเปิดตัว GA: โมเดลเสถียรสำหรับการใช้งานจริงที่ปรับขนาดได้

การเลือกรุ่น Flash ที่เหมาะสม

Gemini 3.5 Flash เป็นโมเดล Flash ที่ชาญฉลาดและมากความสามารถที่สุดของเรา อย่างไรก็ตาม Use Case ที่แตกต่างกันอาจมีข้อกำหนดด้านต้นทุนและเวลาในการตอบสนองที่แตกต่างกัน

Gemini 3.1 Flash-Lite: สำหรับงานที่มีปริมาณมากและมีต้นทุนต่ำ ซึ่งไม่จำเป็นต้องใช้ความสามารถในการให้เหตุผลขั้นสูงของ 3.5 Flash เราขอแนะนำให้ใช้ Gemini 3.1 Flash-Lite ซึ่งเป็นโมเดลระยะยาวที่เสถียรและได้รับการเพิ่มประสิทธิภาพเพื่อประสิทธิภาพ ดูรายละเอียดเพิ่มเติมได้ในคู่มือนักพัฒนา Flash Lite
Gemini 3 Flash เวอร์ชันตัวอย่าง: แม้ว่าเราจะแนะนำให้ย้ายข้อมูลไปยัง 3.5 Flash เพื่อความเสถียรของ GA และการให้เหตุผลที่ดียิ่งขึ้น แต่Gemini 3 Flash (เวอร์ชันตัวอย่าง) จะยังคงพร้อมให้บริการสำหรับนักพัฒนาซอฟต์แวร์ที่ต้องการทดสอบกับโมเดลเวอร์ชันตัวอย่างต่อไป

การเปลี่ยนแปลงพฤติกรรม

ระดับความพยายามเริ่มต้นใหม่: `medium`

ตอนนี้ความพยายามในการคิดเริ่มต้นคือ medium ซึ่งเปลี่ยนจาก high ใน Gemini 3 Flash เวอร์ชันตัวอย่าง medium ให้ผลลัพธ์ที่ดีมากในงานที่หลากหลาย พร้อมทั้งรวดเร็วและคุ้มค่ากว่า สำหรับปัญหาที่ซับซ้อน high จะกระตุ้นให้โมเดลคิดอย่างลึกซึ้งยิ่งขึ้น

ระดับความพยายาม	กรณีที่ควรใช้
`minimal`	เพิ่มประสิทธิภาพเพื่อความเร็วในการตอบสนอง กรณีการใช้งานคล้ายแชท คำตอบข้อเท็จจริงแบบรวดเร็ว การเรียกใช้เครื่องมือที่ง่ายขึ้น
`low`	งานที่ต้องใช้โค้ดและงานที่ต้องใช้เอเจนต์ซึ่งต้องมีเวลาในการตอบสนองที่ต่ำกว่าและมีขั้นตอนน้อยกว่า นอกจากนี้ยังเหมาะสำหรับงานวิเคราะห์และงานเขียนที่ต้องใช้ความคิด
`medium` (ค่าเริ่มต้น)	คุณภาพดีที่สุดสำหรับงานส่วนใหญ่ แนะนำสำหรับโค้ดที่ซับซ้อนและกรณีการใช้งานแบบเอเจนต์
`high`	เพิ่มความสามารถของโมเดลในการคิดและใช้เครื่องมือให้สูงสุด เหมาะที่สุดสำหรับการให้เหตุผลที่ซับซ้อน คณิตศาสตร์ที่ยาก และงานโค้ดหรือเอเจนต์ที่ยากที่สุด อนุญาตให้แสดงความคิดที่ยาวขึ้นและเรียกใช้ฟังก์ชัน

หากต้องการลบล้างค่าเริ่มต้น ให้ตั้งค่า thinking_level ในการกำหนดค่า ดังนี้

Python

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Prove that the square root of 2 is irrational.",
    config: {
      thinkingConfig: {
        thinkingLevel: "HIGH",
      },
    },
  });
  console.log(response.text);
}

main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Prove that the square root of 2 is irrational."}]
    }],
    "generationConfig": {
      "thinkingConfig": {
        "thinkingLevel": "HIGH"
      }
    }
  }'

เคล็ดลับ: เริ่มต้นด้วย medium ซึ่งให้คุณภาพดีที่สุดสำหรับงานส่วนใหญ่ ลองใช้ low เพื่อประสบการณ์ที่รวดเร็วและประหยัดกว่าพร้อมคุณภาพที่ยอดเยี่ยม เปลี่ยนไปใช้ high สำหรับการให้เหตุผลที่ซับซ้อน คณิตศาสตร์ที่ยาก หรือชาเลนจ์การเขียนโค้ดที่ยาก ใช้ minimal เพื่อเพิ่มประสิทธิภาพด้านความเร็วในคำค้นหาอย่างง่าย

ตารางต่อไปนี้แสดงระดับการคิดที่โมเดลแต่ละรายการรองรับ

ระดับการคิด	Gemini 3.5 Flash	Gemini 3.1 Pro	Gemini 3.1 Flash-Lite	Gemini 3 Flash	คำอธิบาย
`minimal`	สิ่งที่ทำได้	สิ่งที่ทำไม่ได้	รองรับ (ค่าเริ่มต้น)	สิ่งที่ทำได้	ตรงกับการตั้งค่า "ไม่ต้องคิด" สำหรับคำค้นหาส่วนใหญ่ โปรดทราบว่า `minimal` ไม่รับประกันว่าการคิดจะปิดอยู่ โมเดลอาจให้เหตุผลน้อยมากสำหรับงานที่ซับซ้อน
`low`	สิ่งที่ทำได้	สิ่งที่ทำได้	สิ่งที่ทำได้	สิ่งที่ทำได้	ลดเวลาในการตอบสนองและค่าใช้จ่าย
`medium`	รองรับ (ค่าเริ่มต้น)	สิ่งที่ทำได้	สิ่งที่ทำได้	สิ่งที่ทำได้	การคิดแบบสมดุลสำหรับงานส่วนใหญ่
`high`	รองรับ (ไดนามิก)	รองรับ (ค่าเริ่มต้น, ไดนามิก)	รองรับ (ไดนามิก)	รองรับ (ค่าเริ่มต้น, ไดนามิก)	เพิ่มความลึกในการให้เหตุผลสูงสุด

การเก็บรักษาความคิด

โมเดลจะคงการให้เหตุผลระดับกลางในการสนทนาแบบหลายรอบ โดยอัตโนมัติ เมื่อมีอยู่ในประวัติการสนทนา บริบทการให้เหตุผล จะส่งต่อ ซึ่งช่วยปรับปรุงประสิทธิภาพในงานที่ซับซ้อนแบบหลายขั้นตอน เช่น การแก้ไขข้อบกพร่องแบบวนซ้ำและการปรับโครงสร้างโค้ด ไม่ต้องเปลี่ยนแปลง API

API การโต้ตอบ: ระบบจะเก็บความคิดเห็นไว้โดยอัตโนมัติอยู่แล้ว ไม่มี การเปลี่ยนแปลงลักษณะการทำงาน
GenerateContent API: ตั้งแต่ Gemini 3.5 Flash เป็นต้นไป โมเดลจะใช้ บริบทการให้เหตุผลจากทุกช่วงก่อนหน้าเมื่อมีลายเซ็นความคิด ในประวัติการสนทนา หากต้องการเปิดใช้ ให้ส่งประวัติการสนทนาแบบเต็ม ที่ไม่มีการแก้ไข (รวมถึงลายเซ็นความคิด) ใน contents SDK จะจัดการเรื่องนี้โดยอัตโนมัติ

การอัปเดตพารามิเตอร์และแนวทางปฏิบัติแนะนำใน Gemini 3.x

ข้อกำหนดต่อไปนี้มีผลกับโมเดล Gemini 3.x ทั้งหมด ซึ่งรวมถึง Gemini 3.5 Flash

temperature, top_p, top_k: เราขอแนะนำอย่างยิ่งว่าไม่ควรเปลี่ยน ค่าเริ่มต้น ความสามารถในการให้เหตุผลของ Gemini 3 ได้รับการเพิ่มประสิทธิภาพสำหรับการ ตั้งค่าเริ่มต้น
ให้ใช้ thinking_level แทน thinking_budget
การจับคู่การตอบกลับการเรียกฟังก์ชัน: id, name และจำนวนการตอบกลับ ต้องตรงกับการเรียกก่อนหน้า
การตอบกลับฟังก์ชันมัลติโมดอล: ใส่เนื้อหามัลติโมดอลไว้ภายใน การตอบกลับฟังก์ชัน ไม่ใช่นอกการตอบกลับ
วิธีการในบรรทัดในการตอบกลับฟังก์ชัน: ต่อท้ายข้อความการตอบกลับฟังก์ชัน ไม่ใช่เป็นส่วนแยกต่างหาก
ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น: ใช้ระดับการคิดที่ต่ำลงหรือทดลอง กับคำสั่งของระบบเพื่อลดการเรียกใช้เครื่องมือในเวิร์กโฟลว์ของเอเจนต์

ดูวิธีอัปเดตโค้ดได้ในส่วนต่างๆ ด้านล่าง

พารามิเตอร์การสุ่มตัวอย่าง (ไม่แนะนําอีกต่อไป)

เราไม่แนะนำให้ใช้ temperature, top_p และ top_k กับโมเดล Gemini 3.x ทั้งหมดอีกต่อไป ความสามารถในการให้เหตุผลของ Gemini 3 ได้รับการเพิ่มประสิทธิภาพสำหรับการตั้งค่าเริ่มต้น นำพารามิเตอร์เหล่านี้ออกจากคำขอทั้งหมด

# ⚠️ Remove these parameters (not recommended)
config = types.GenerateContentConfig(
    temperature=0.7,
    top_p=0.9,
    top_k=40
)

เราขอแนะนำให้กำหนดคำสั่งของระบบด้วยกฎที่ชัดเจนสำหรับกรณีการใช้งานเฉพาะของคุณเพื่อให้มั่นใจถึงความแน่นอน

`thinking_budget` (ไม่แนะนำอีกต่อไป)

เราไม่แนะนำให้ใช้พารามิเตอร์ตัวเลขดิบ thinking_budget ในโมเดล Gemini 3.x ทั้งหมดอีกต่อไป ให้ใช้สตริง Enum thinking_level แทน

# ⚠️ Before (not recommended)
config = types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(thinking_budget=7500)
)

# ✅ After
config = types.GenerateContentConfig(
    thinking_config=types.ThinkingConfig(thinking_level="medium")
)

ค่าที่ใช้ได้: minimal, low, medium (ค่าเริ่มต้น) และ high

การเรียกใช้ฟังก์ชัน: การจับคู่คำตอบที่เข้มงวด

ปัจจุบัน Interactions API จะแสดงข้อผิดพลาดเมื่อการตอบกลับฟังก์ชันไม่ตรงกัน API GenerateContent ยังไม่แสดงข้อผิดพลาด แต่การตอบกลับที่ไม่ตรงกันจะทำให้โมเดล แสดงการตอบกลับที่ว่างเปล่าพร้อม finish_reason: STOP ในกรณีส่วนใหญ่ โปรด ทำตามรูปแบบต่อไปนี้เสมอ

ข้อกำหนด	รายละเอียด
รวม `id`	`FunctionResponse` ทุกรายการต้องมี `id` จาก `FunctionCall` ที่เกี่ยวข้อง
แมตช์ที่ `name`	`name` ในการตอบกลับต้องตรงกับ `name` ในการเรียก
จำนวนการจับคู่ที่ตรงกัน	ส่งคืน `FunctionResponse` 1 รายการสำหรับ `FunctionCall` แต่ละรายการที่ได้รับ

Python

# ✅ Include matching id and name in the function response
final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={"result": result},
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Include matching id and name in the function response
const functionResponsePart = {
  functionResponse: {
    name: toolCall.name,
    response: { result: result },
    id: toolCall.id,
  },
};

const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    { role: "user", parts: [functionResponsePart] },
  ],
  config: config,
});

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {"role": "user", "parts": [{"text": "..."}]},
      {"role": "model", "parts": [{"functionCall": {"name": "my_function", "args": {...}}}]},
      {"role": "user", "parts": [{"functionResponse": {"name": "my_function", "id": "call_id", "response": {"result": "..."}}}]}
    ]
  }'

คำตอบของฟังก์ชันมัลติโมดัล

เรามักเห็นลูกค้าให้รูปภาพนอกการตอบกลับฟังก์ชัน ซึ่งอาจทำให้โมเดลทํางานอย่างไม่คาดคิด (เช่น การรั่วไหลของความคิด) และส่งผลให้เอาต์พุตมีคุณภาพต่ำลง โปรดทำตามคำแนะนำในเอกสารประกอบเกี่ยวกับ Multimodal Function Responses API แทน และรวมเนื้อหามัลติโมดัลไว้ในส่วนการตอบกลับฟังก์ชันที่คุณส่งไปยังโมเดล โมเดลสามารถประมวลผลเนื้อหามัลติโมดัลนี้ในรอบถัดไป เพื่อสร้างคำตอบที่รอบรู้มากขึ้น

Python

# ✅ Include multimodal content in the function response
final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={
                    "result": "instrument.jpg",
                    "image": base64_image_data,
                },
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Include multimodal content in the function response
const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    {
      role: "user",
      parts: [{
        functionResponse: {
          name: toolCall.name,
          id: toolCall.id,
          response: {
            result: "instrument.jpg",
            image: base64ImageData,
          },
        },
      }],
    },
  ],
  config: config,
});

คำสั่งในบรรทัดในคำตอบของฟังก์ชัน

เรามักเห็นลูกค้าให้คำสั่งเพิ่มเติมพร้อมกับการตอบกลับฟังก์ชัน เป็นPartsในภายหลัง ซึ่งอาจทำให้โมเดลทำงานโดยไม่คาดคิด (เช่น การรั่วไหลของความคิด) และส่งผลให้เอาต์พุตมีคุณภาพต่ำลง แต่ให้ต่อท้ายคำสั่งเพิ่มเติม ไว้ที่ท้ายข้อความคำตอบของฟังก์ชันโดยคั่นด้วยบรรทัดใหม่ 2 บรรทัด

Python

# ✅ Append inline instructions to the end of the function response separated by two newlines
result_text = f"{json.dumps(result)}\n\n<your inline instructions>"

final_response = client.models.generate_content(
    model="gemini-3.5-flash",
    config=config,
    contents=[
        *previous_contents,
        response.candidates[0].content,
        types.Content(role="user", parts=[
            types.Part.from_function_response(
                name=tool_call.name,
                response={"result": result_text},
                id=tool_call.id,
            )
        ]),
    ],
)

JavaScript

// ✅ Append inline instructions to the end of the function response separated by two newlines
const resultText = `${JSON.stringify(result)}\n\n<your inline instructions>`;

const finalResponse = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: [
    ...previousContents,
    { role: "model", parts: [{ functionCall: toolCall }] },
    {
      role: "user",
      parts: [{
        functionResponse: {
          name: toolCall.name,
          id: toolCall.id,
          response: { result: resultText },
        },
      }],
    },
  ],
  config: config,
});

ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น

หากพบว่ามีการเรียกใช้เครื่องมือมากเกินไป เทคนิค 2 อย่างต่อไปนี้จะช่วยลดการเรียกใช้เครื่องมือได้

เริ่มต้นด้วยการลดระดับการคิด (medium, low หรือ minimal) ระดับการคิดที่สูงขึ้นจะกระตุ้นให้โมเดลใช้เครื่องมือมากขึ้นเพื่อสำรวจและ ยืนยัน ดังนั้นการลดระดับจึงช่วยลดการเรียกใช้เครื่องมือได้
เพิ่มคำสั่งของระบบ: หากยังคงมีการใช้งานมากเกินไปหลังจากปรับ ระดับการคิดแล้ว ให้ลองใช้พรอมต์ที่จำกัดการใช้เครื่องมือ เช่น
```
You have a limited action budget of <n> tool calls. Use them efficiently.
```

รายการตรวจสอบการย้ายข้อมูล

ย้ายข้อมูลจาก Gemini 3 Flash (เวอร์ชันตัวอย่าง)

อัปเดตชื่อโมเดล: gemini-3-flash-preview → gemini-3.5-flash
ตรวจสอบราคา Gemini 3.5 Flash มีราคาสูงกว่า Gemini 3 Flash เวอร์ชันตัวอย่าง หากกรณีการใช้งานของคุณมีความไวต่อต้นทุนสูง ให้พิจารณาย้ายข้อมูลไปใช้ Gemini 3.1 Flash-Lite แทน ดูรายละเอียดได้ที่หน้าการกำหนดราคา
นำ temperature, top_p, top_k ออกจากไฟล์กำหนดค่า (ไม่แนะนำอีกต่อไป)
แทนที่ thinking_budget ด้วย thinking_level
เพิ่ม id และ name ที่ตรงกันลงในชิ้นส่วน FunctionResponse ทั้งหมด
ทดสอบพรอมต์ เปลี่ยนความพยายามเริ่มต้นจาก high → medium; ตรวจสอบ คุณภาพ ความเร็ว และต้นทุน
ตอนนี้ระบบจะเปิดใช้การรักษาความคิดโดยค่าเริ่มต้น บริบทการให้เหตุผลจะคงอยู่ ในแต่ละรอบ ซึ่งจะช่วยปรับปรุงประสิทธิภาพ แต่ก็อาจเพิ่มการใช้โทเค็น
ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น: เริ่มด้วยการลดระดับการคิด (medium, low หรือ minimal) เพิ่มคำสั่งของระบบเพื่อจำกัดเครื่องมือ หากยังมีการใช้งานมากเกินไป
Gemini 3.5 Flash ยังไม่รองรับการใช้งานคอมพิวเตอร์ในขณะนี้ สำหรับเวิร์กโหลดการใช้งานคอมพิวเตอร์ ให้ใช้ Gemini 3 Flash Preview ต่อไป

ย้ายข้อมูลจาก Gemini 2.5

ทั้งหมดที่กล่าวมา รวมถึง

ทำให้พรอมต์ง่ายขึ้น หากคุณใช้วิศวกรรมพรอมต์ (Prompt Engineering) แบบเชนออฟธ็อตเพื่อบังคับให้มีการให้เหตุผล ให้ลองใช้ thinking_level: "medium" หรือ "high" กับพรอมต์ที่เรียบง่ายกว่าแทน
ทดสอบปริมาณงาน PDF และสื่อ หากคุณอาศัยลักษณะการทำงานที่เฉพาะเจาะจงสำหรับการแยกวิเคราะห์เอกสารแบบหนาแน่น ให้ทดสอบการตั้งค่า media_resolution_high เพื่อให้มั่นใจว่ายังคงมีความแม่นยำต่อไป การย้ายข้อมูลไปยังค่าเริ่มต้นของ Gemini 3 อาจเพิ่มการใช้โทเค็น สำหรับ PDF แต่ลดการใช้โทเค็นสำหรับวิดีโอ หากคำขอเกินหน้าต่างบริบท ให้ลด media_resolution อย่างชัดเจน ดูรายละเอียดได้ในเอกสารประกอบเกี่ยวกับความละเอียดของสื่อ
ใช้ประโยชน์จากการใช้เครื่องมือร่วมกัน คุณใช้ Google Search, บริบท URL, การเรียกใช้โค้ด และฟังก์ชันที่กำหนดเองได้ ในคำขอเดียวกัน
หากใช้การตอบกลับฟังก์ชันแบบมัลติโมดัล ให้ย้ายเนื้อหาแบบมัลติโมดัลไปไว้ใน ส่วนการตอบกลับฟังก์ชัน ไม่ใช่ข้างๆ
หากใช้คำสั่งในบรรทัดกับคำตอบของฟังก์ชัน ให้ต่อท้ายคำสั่งเหล่านั้นกับข้อความคำตอบของฟังก์ชันโดยคั่นด้วยบรรทัดใหม่ 2 บรรทัด ไม่ใช่เป็นส่วนแยกต่างหาก
Gemini 3.x ไม่รองรับการแบ่งกลุ่มรูปภาพ สำหรับเวิร์กโหลดการแบ่งกลุ่ม ให้ใช้ Gemini 2.5 Flash ต่อโดยปิดการคิด หรือใช้ Gemini Robotics-ER 1.6

ฟีเจอร์ของตระกูล Gemini 3

Gemini 3.5 Flash จะรับช่วงความสามารถทั้งหมดของตระกูล Gemini 3 ยกเว้นการใช้คอมพิวเตอร์ ฟีเจอร์ที่เปิดตัวใน Gemini 3 และจะยังคงมีต่อไป

การคิด: บริบทการให้เหตุผลที่เข้ารหัสจะยังคงอยู่ในการเรียก API อัตโนมัติใน Interactions API และโดยนัยใน GenerateContent
เอาต์พุตที่มีโครงสร้างพร้อมเครื่องมือ: รวมโหมด JSON กับ เครื่องมือในตัว (การค้นหา, บริบท URL, การดำเนินการโค้ด, การเรียกใช้ฟังก์ชัน)
การตอบกลับฟังก์ชันหลายรูปแบบ: แสดง รูปภาพ เสียง และสื่ออื่นๆ ในผลการเรียกใช้ฟังก์ชัน
การดำเนินการโค้ดด้วยรูปภาพ: ดำเนินการโค้ดที่ ประมวลผลและสร้างรูปภาพ
การใช้เครื่องมือร่วมกัน: ใช้เครื่องมือในตัวและการเรียกใช้ฟังก์ชันที่กำหนดเองในคำขอเดียวกัน
ความละเอียดของสื่อ: การควบคุมการจัดสรรโทเค็นอย่างละเอียดสำหรับอินพุตรูปภาพ วิดีโอ และ PDF โมเดล Gemini 3 รองรับการตั้งค่าความละเอียดต่อรายการเนื้อหา (low, medium, high, ultra_high) สำหรับพรอมต์ที่มีความเที่ยงตรงแบบผสม
ลายเซ็นความคิด: การแสดงการให้เหตุผลภายในของโมเดลที่เข้ารหัส ต้องระบุสำหรับการเรียกใช้ฟังก์ชันแบบหลายรอบ ซึ่ง SDK อย่างเป็นทางการจะจัดการโดยอัตโนมัติ

แนวทางปฏิบัติแนะนำในการเขียนพรอมต์

โมเดล Gemini 3.x เป็นโมเดลการให้เหตุผล ซึ่งจะเปลี่ยนวิธีที่คุณควรใช้พรอมต์

คำสั่งที่แม่นยำ: ใช้คำสั่งที่กระชับ Gemini 3.x ตอบสนองต่อคำสั่งที่ชัดเจนและตรงไปตรงมาได้ดีที่สุด เทคนิควิศวกรรมพรอมต์ที่ซับซ้อนหรือมีรายละเอียดมากเกินไปซึ่งออกแบบมา สำหรับโมเดลรุ่นเก่าอาจทำให้โมเดลวิเคราะห์มากเกินไป
ความละเอียดของเอาต์พุต: โดยค่าเริ่มต้น Gemini 3.x จะมีรายละเอียดน้อยกว่าและชอบคำตอบที่ตรงไปตรงมาและมีประสิทธิภาพ หาก Use Case ของคุณต้องใช้ภาษาที่เป็นกันเอง ให้ชี้นำโมเดลอย่างชัดเจนในพรอมต์ (เช่น "อธิบายสิ่งนี้ในฐานะ ผู้ช่วยที่เป็นมิตรและช่างพูด")
การจัดการบริบท: เมื่อทำงานกับชุดข้อมูลขนาดใหญ่ (เช่น หนังสือทั้งเล่ม ฐานโค้ด หรือวิดีโอยาว) ให้วางคำสั่งหรือคำถามที่เฉพาะเจาะจงไว้ท้ายพรอมต์หลังจากบริบทของข้อมูล ยึดตรรกะของโมเดลโดยเริ่มคำถามด้วยวลี เช่น "จากข้อมูลก่อนหน้า..."

ดูข้อมูลเพิ่มเติมเกี่ยวกับกลยุทธ์การออกแบบพรอมต์ได้ในคู่มือวิศวกรรมพรอมต์ (Prompt Engineering)

ข้อจำกัด

Gemini 3.x ไม่รองรับการแบ่งกลุ่มรูปภาพ สำหรับเวิร์กโหลดการแบ่งกลุ่ม ให้ใช้ Gemini 2.5 Flash ต่อโดยปิดการคิด หรือใช้ Gemini Robotics-ER 1.6

คำถามที่พบบ่อย

ข้อมูลล่าสุดของ Gemini 3.5 Flash คือเมื่อใด Gemini 3.5 Flash มีการตัดข้อมูลความรู้ ณ เดือนมกราคม 2025 ดูข้อมูลล่าสุดได้ที่เครื่องมือการอ้างอิงการค้นหา
ขีดจำกัดของหน้าต่างบริบทคืออะไร Gemini 3.5 Flash รองรับหน้าต่างบริบทของอินพุตขนาด 1 ล้านโทเค็นและโทเค็นเอาต์พุตสูงสุด 65,000 โทเค็น
โค้ด thinking_budget เก่าของฉันจะยังใช้งานได้ไหม ได้ thinking_budget ยังคงรองรับการทำงานร่วมกับเวอร์ชันก่อนหน้า แต่เราขอแนะนำให้ย้ายข้อมูลไปยัง thinking_level เพื่อให้ได้ประสิทธิภาพที่คาดการณ์ได้มากขึ้น แต่อย่าใช้ทั้ง 2 อย่างในคำขอเดียวกัน
Gemini 3.5 Flash รองรับ Batch API ไหม ได้ ดูรายละเอียดได้ที่คู่มือ Batch API
ระบบรองรับการแคชบริบทไหม ได้ ระบบรองรับการแคชบริบท
เครื่องมือใดบ้างที่รองรับ Gemini 3.5 Flash รองรับ Google Search การอ้างอิงจาก Google Maps การค้นหาไฟล์ การเรียกใช้โค้ด บริบท URL และ การเรียกใช้ฟังก์ชันมาตรฐาน รวมถึง การใช้เครื่องมือร่วมกัน การใช้คอมพิวเตอร์ไม่รองรับ ใน Gemini 3.5 Flash

ขั้นตอนถัดไป

ดูข้อมูลเพิ่มเติมเกี่ยวกับกลยุทธ์การออกแบบพรอมต์ได้ในคู่มือวิศวกรรมพรอมต์ (Prompt Engineering)
เริ่มต้นใช้งาน Gemini 3 Cookbook
ดูข้อมูลเกี่ยวกับการเพิ่มประสิทธิภาพและการอนุมานของ Gemini API

มีอะไรใหม่ใน Gemini 3.5 Flash

โมเดลใหม่

คู่มือเริ่มใช้งานฉบับย่อ

Python

JavaScript

REST

มีอะไรใหม่

การเลือกรุ่น Flash ที่เหมาะสม

การเปลี่ยนแปลงพฤติกรรม

ระดับความพยายามเริ่มต้นใหม่: medium

Python

JavaScript

REST

การเก็บรักษาความคิด

การอัปเดตพารามิเตอร์และแนวทางปฏิบัติแนะนำใน Gemini 3.x

พารามิเตอร์การสุ่มตัวอย่าง (ไม่แนะนําอีกต่อไป)

thinking_budget (ไม่แนะนำอีกต่อไป)

การเรียกใช้ฟังก์ชัน: การจับคู่คำตอบที่เข้มงวด

Python

JavaScript

REST

คำตอบของฟังก์ชันมัลติโมดัล

Python

JavaScript

คำสั่งในบรรทัดในคำตอบของฟังก์ชัน

Python

JavaScript

ลดการเรียกใช้เครื่องมือที่ไม่จำเป็น

รายการตรวจสอบการย้ายข้อมูล

ย้ายข้อมูลจาก Gemini 3 Flash (เวอร์ชันตัวอย่าง)

ย้ายข้อมูลจาก Gemini 2.5

ฟีเจอร์ของตระกูล Gemini 3

แนวทางปฏิบัติแนะนำในการเขียนพรอมต์

ข้อจำกัด

คำถามที่พบบ่อย

ขั้นตอนถัดไป

ระดับความพยายามเริ่มต้นใหม่: `medium`

`thinking_budget` (ไม่แนะนำอีกต่อไป)