Chiến lược thiết kế câu lệnh

Trang này giới thiệu cho bạn một số chiến lược thiết kế lời nhắc chung mà bạn có thể sử dụng khi thiết kế lời nhắc.

Mô hình ngôn ngữ lớn (LLM) được huấn luyện bằng một lượng lớn dữ liệu văn bản để tìm hiểu các mẫu và mối quan hệ giữa ngôn ngữ. Khi được cung cấp một số văn bản (câu lệnh), các mô hình ngôn ngữ có thể dự đoán nội dung có khả năng xảy ra tiếp theo, chẳng hạn như một công cụ tự động hoàn thành tinh vi.

Google AI Studio lưu trữ một thư viện câu lệnh đơn giản nhằm giới thiệu một cách tương tác nhiều khái niệm được chia sẻ trong hướng dẫn này. Trong phần còn lại của hướng dẫn này, bạn sẽ tìm hiểu về các chiến lược thiết kế câu lệnh sau:

Cung cấp hướng dẫn rõ ràng và cụ thể

Việc đưa ra hướng dẫn cho mô hình về việc cần làm là một cách hiệu quả và hiệu quả để tuỳ chỉnh hành vi của mô hình. Đảm bảo rằng hướng dẫn của bạn rõ ràng và cụ thể. Hướng dẫn có thể đơn giản như một danh sách hướng dẫn từng bước hoặc phức tạp như phác thảo trải nghiệm và tư duy của người dùng.

Xác định tác vụ cần thực hiện

Mô tả chi tiết nhiệm vụ mà bạn muốn mô hình thực hiện. Nhiệm vụ có thể đơn giản như một danh sách hướng dẫn từng bước hoặc phức tạp như việc lập bản đồ trải nghiệm và tư duy của người dùng. Lời nhắc sau đây yêu cầu mô hình tóm tắt một khối văn bản:

Summarize this text:
Text: A quantum computer exploits quantum mechanical phenomena to perform calculations exponentially
faster than any modern traditional computer. At very tiny scales, physical matter acts as both
particles and as waves, and quantum computing uses specialized hardware to leverage this behavior.
The operating principles of quantum devices is beyond the scope of classical physics. When deployed
at scale, quantum computers could be used in a wide variety of applications such as: in
cybersecurity to break existing encryption methods while helping researchers create new ones, in
meteorology to develop better weather forecasting etc. However, the current state of the art quantum
computers are still largely experimental and impractical.
  
    Quantum computers leverage the wave-particle duality of matter at tiny scales to perform
    calculations exponentially faster than traditional computers. They harness quantum phenomena,
    which are beyond the scope of classical physics, to achieve this speed advantage. While
    promising for applications like cybersecurity, weather forecasting, and beyond, current
    quantum computers are still experimental and not yet practical for widespread use.
  

Chỉ định mọi quy tắc ràng buộc

Chỉ định mọi quy tắc ràng buộc về việc đọc câu lệnh hoặc tạo phản hồi. Bạn có thể cho mô hình biết những việc nên làm và không nên làm. Trong ví dụ trước, nội dung tóm tắt sẽ ngắn hơn văn bản gốc, nhưng có thể bạn muốn nội dung tóm tắt ngắn hơn. Trong trường hợp này, bạn có thể chỉ định một quy tắc ràng buộc trong câu lệnh về thời lượng mà bạn muốn tóm tắt:

Summarize this text in two sentences:
Text: A quantum computer exploits quantum mechanical phenomena to perform calculations exponentially
faster than any modern traditional computer. At very tiny scales, physical matter acts as both
particles and as waves, and quantum computing uses specialized hardware to leverage this behavior.
The operating principles of quantum devices is beyond the scope of classical physics. When deployed
at scale, quantum computers could be used in a wide variety of applications such as: in
cybersecurity to break existing encryption methods while helping researchers create new ones, in
meteorology to develop better weather forecasting etc. However, the current state of the art quantum
computers are still largely experimental and impractical.
    

      Quantum computers harness the wave-particle duality of matter at the quantum level to perform
      computations exponentially faster than traditional computers. While these machines hold
      immense potential for fields like cybersecurity and weather forecasting, they are currently
      in their early stages of development and not yet practical for widespread use.
    

Xác định định dạng của phản hồi

Bạn cũng có thể đưa ra hướng dẫn nêu rõ định dạng của câu trả lời. Ví dụ: bạn có thể yêu cầu định dạng câu trả lời dưới dạng bảng, danh sách đầu dòng, bản giới thiệu ngắn gọn, từ khoá, câu hoặc đoạn văn. Thông báo hệ thống sau đây hướng dẫn mô hình trả lời theo cách trò chuyện hơn:

    All questions should be answered comprehensively with details, unless the user requests a
    concise response specifically. Respond in the same language as the query.
  
    What is a smart way to create a lemonade business?
  
Launching a Successful Lemonade Stand: A Smart Approach
Creating a lemonade business, whether a simple stand or a larger operation, requires strategic thinking. Here's a breakdown of how to approach it smartly:

1. Define Your Business:
Scope: Are you aiming for a small, seasonal lemonade stand, a food truck, a delivery service, or something else entirely?
Target Audience: Who are you selling to? Families, office workers, tourists?
Unique Selling Proposition: What sets your lemonade apart? Special flavors, organic ingredients, a unique recipe?

Pricing: Research competitor prices and determine a profitable pricing structure.
Location: Consider foot traffic, accessibility, and regulations for your chosen location.
.....
  

Tóm tắt

  • Hướng dẫn mô hình về việc cần làm.
  • Hãy làm cho các hướng dẫn rõ ràng và cụ thể.
  • Chỉ định mọi quy tắc ràng buộc hoặc yêu cầu định dạng cho đầu ra.

Thêm ví dụ về ít lần chụp

Bạn có thể đưa vào lời nhắc các ví dụ cho mô hình biết cách làm đúng. Mô hình này cố gắng xác định các mẫu và mối quan hệ từ các ví dụ, đồng thời áp dụng các mẫu và mối quan hệ đó khi tạo phản hồi. Câu lệnh có chứa một vài ví dụ được gọi là câu lệnh ít lần, còn câu lệnh không cung cấp ví dụ được gọi là câu lệnh không có lần. Lời nhắc ít lần xuất hiện thường được dùng để điều chỉnh định dạng, cách diễn đạt, phạm vi hoặc mẫu chung của các câu trả lời của mô hình. Hãy sử dụng các ví dụ cụ thể và đa dạng để giúp mô hình thu hẹp trọng tâm và tạo ra kết quả chính xác hơn.

Bạn nên luôn đưa ví dụ về một vài lần chụp vào câu lệnh. Lời nhắc không có ví dụ về một vài lần có thể kém hiệu quả hơn. Trên thực tế, bạn có thể xoá hướng dẫn khỏi câu lệnh nếu ví dụ của bạn đủ rõ ràng để cho thấy nhiệm vụ hiện tại.

Lời nhắc không có ví dụ so với lời nhắc có một vài ví dụ

Lời nhắc không có ví dụ sau đây yêu cầu mô hình chọn nội dung giải thích phù hợp nhất.

Please choose the best explanation to the question:

Question: How is snow formed?
Explanation1: Snow is formed when water vapor in the air freezes into ice crystals in the
atmosphere, which can combine and grow into snowflakes as they fall through the atmosphere and
accumulate on the ground.
Explanation2: Water vapor freezes into ice crystals forming snow.
Answer:
  
Explanation 1 is the best explanation.
  

Nếu trường hợp sử dụng của bạn yêu cầu mô hình tạo ra câu trả lời ngắn gọn, bạn có thể đưa các ví dụ vào lời nhắc ưu tiên câu trả lời ngắn gọn.

Lời nhắc sau đây đưa ra hai ví dụ cho thấy ưu tiên đối với nội dung giải thích ngắn hơn. Trong phản hồi, bạn có thể thấy rằng các ví dụ đã hướng dẫn mô hình chọn nội dung giải thích ngắn hơn (Explanation2) thay vì nội dung giải thích dài hơn (Explanation1) như trước đây.

Below are some examples showing a question, explanation, and answer format:

Question: Why is sky blue?
Explanation1: The sky appears blue because of Rayleigh scattering, which causes shorter blue
wavelengths of light to be scattered more easily than longer red wavelengths, making the sky look
blue.
Explanation2: Due to Rayleigh scattering effect.
Answer: Explanation2

Question: What is the cause of earthquakes?
Explanation1: Sudden release of energy in the Earth's crust.
Explanation2: Earthquakes happen when tectonic plates suddenly slip or break apart, causing a
release of energy that creates seismic waves that can shake the ground and cause damage.
Answer: Explanation1

Now, Answer the following question given the example formats above:

Question: How is snow formed?
Explanation1: Snow is formed when water vapor in the air freezes into ice crystals in the
atmosphere, which can combine and grow into snowflakes as they fall through the atmosphere and
accumulate on the ground.
Explanation2: Water vapor freezes into ice crystals forming snow.
Answer:
  
Answer: Explanation2
  

Tìm số lượng ví dụ tối ưu

Bạn có thể thử nghiệm với số lượng ví dụ cần cung cấp trong lời nhắc để có được kết quả mong muốn nhất. Các mô hình như Gemini thường có thể nhận ra các mẫu bằng một vài ví dụ, mặc dù bạn có thể cần thử nghiệm số lượng ví dụ dẫn đến kết quả mong muốn. Đồng thời, nếu bạn đưa vào quá nhiều ví dụ, mô hình có thể bắt đầu phù hợp quá mức với phản hồi cho các ví dụ đó.

Sử dụng ví dụ để trình bày các mẫu thay vì các mẫu đối lập

Việc sử dụng các ví dụ để hiển thị cho mô hình một mẫu cần tuân theo sẽ hiệu quả hơn so với việc sử dụng các ví dụ để cho mô hình thấy một mẫu phản mẫu cần tránh.

Mẫu phủ định:

Don't end haikus with a question:
Haiku are fun
A short and simple poem
Don't you enjoy them?
  

Mẫu tích cực:

Always end haikus with an assertion:
Haiku are fun
A short and simple poem
A joy to write
  

Sử dụng định dạng nhất quán trong các ví dụ

Hãy đảm bảo rằng cấu trúc và định dạng của các ví dụ chụp vài lần đều giống nhau để tránh các phản hồi có định dạng không mong muốn. Một trong những mục tiêu chính của việc thêm ví dụ về ít lần xuất hiện trong câu lệnh là cho mô hình biết định dạng phản hồi. Do đó, điều quan trọng là phải đảm bảo định dạng nhất quán trên tất cả các ví dụ, đặc biệt là chú ý đến các thẻ XML, khoảng trắng, dòng mới và trình phân tách ví dụ.

Tóm tắt

  • Việc đưa các ví dụ về câu trả lời vào câu lệnh sẽ giúp mô hình học cách trả lời.
  • Cung cấp cho mô hình các ví dụ về mẫu cần tuân theo thay vì các ví dụ về mẫu cần tránh.
  • Hãy thử nghiệm số lượng câu lệnh cần đưa vào. Tuỳ thuộc vào mô hình, có quá ít ví dụ không hiệu quả trong việc thay đổi hành vi của mô hình. Quá nhiều ví dụ khiến mô hình này quá tải.
  • Sử dụng định dạng nhất quán cho các ví dụ

Thêm thông tin theo bối cảnh

Bạn có thể đưa vào lời nhắc hướng dẫn và thông tin mà mô hình cần để giải quyết vấn đề thay vì giả định rằng mô hình có tất cả thông tin cần thiết. Thông tin theo ngữ cảnh này giúp mô hình hiểu được các quy tắc ràng buộc và thông tin chi tiết về việc bạn yêu cầu mô hình thực hiện.

Ví dụ sau đây yêu cầu mô hình đưa ra hướng dẫn khắc phục sự cố cho một bộ định tuyến:

What should I do to fix my disconnected wifi? The light on my Google Wifi router is yellow and
blinking slowly.
  
  A yellow blinking light on your Google Wifi router usually indicates a problem with the internet connection. Here are some steps to troubleshoot and fix the issue:
  1. Restart your router and modem:
    - Unplug your modem from the power outlet and wait for 30 seconds.
    - Plug your modem back in and wait for it to fully boot up.
    - Unplug your Google Wifi router and wait for 30 seconds.
    - Plug your Google Wifi router back in and wait for it to fully boot up.
.....
  

Phản hồi có vẻ như là thông tin khắc phục sự cố chung không dành riêng cho bộ định tuyến hoặc trạng thái của đèn chỉ báo LED.

Để tuỳ chỉnh phản hồi cho một bộ định tuyến cụ thể, bạn có thể thêm hướng dẫn khắc phục sự cố của bộ định tuyến vào lời nhắc dưới dạng ngữ cảnh để bộ định tuyến tham khảo khi cung cấp phản hồi.

Answer the question using the text below. Respond with only the text provided.
Question: What should I do to fix my disconnected wifi? The light on my Google Wifi router is yellow and blinking slowly.

Text:
Color: Slowly pulsing yellow
What it means: There is a network error.
What to do:
Check that the Ethernet cable is connected to both your router and your modem and both devices are turned on. You might need to unplug and plug in each device again.

Color: Fast blinking yellow
What it means: You are holding down the reset button and are factory resetting this device.
What to do:
If you keep holding down the reset button, after about 12 seconds, the light will turn solid yellow. Once it is solid yellow, let go of the factory reset button.

Color: Solid yellow
What it means: Router is factory resetting.
What to do:
This can take up to 10 minutes. When it's done, the device will reset itself and start pulsing white, letting you know it's ready for setup.

Color: Solid red
What it means: Something is wrong.
What to do:
Critical failure. Factory reset the router. If the light stays red, contact Wifi customer support.
  
Check that the Ethernet cable is connected to both your router and your modem and both devices are turned on. You might need to unplug and plug in each device again.
  

Tóm tắt

  • Thêm thông tin (ngữ cảnh) vào câu lệnh mà bạn muốn mô hình sử dụng khi tạo phản hồi.
  • Hướng dẫn mô hình cách sử dụng thông tin theo bối cảnh.

Thêm tiền tố

Tiền tố là một từ hoặc cụm từ mà bạn thêm vào nội dung lời nhắc. Tiền tố có thể phục vụ nhiều mục đích, tuỳ thuộc vào vị trí bạn đặt tiền tố:

  • Tiền tố đầu vào: Thêm tiền tố vào các tín hiệu đầu vào có ý nghĩa ngữ nghĩa của phần đầu vào vào mô hình. Ví dụ: tiền tố "Tiếng Anh:" và "Tiếng Pháp:" phân định hai ngôn ngữ khác nhau.
  • Tiền tố đầu ra: Mặc dù đầu ra do mô hình tạo ra, nhưng bạn có thể thêm tiền tố cho đầu ra trong lời nhắc. Tiền tố đầu ra cung cấp cho mô hình thông tin về nội dung dự kiến sẽ được trả về. Ví dụ: tiền tố đầu ra "JSON:" báo hiệu cho mô hình rằng dữ liệu đầu ra phải ở định dạng JSON.
  • Ví dụ về tiền tố: Trong các câu lệnh ít lần, việc thêm tiền tố vào các ví dụ sẽ cung cấp các nhãn mà mô hình có thể sử dụng khi tạo đầu ra, giúp dễ dàng phân tích cú pháp nội dung đầu ra hơn.

Trong ví dụ sau, "Text:" là tiền tố đầu vào và "The answer is:" là tiền tố đầu ra.

Classify the text as one of the following categories.
- large
- small
Text: Rhino
The answer is: large
Text: Mouse
The answer is: small
Text: Snail
The answer is: small
Text: Elephant
The answer is:
  
The answer is: large
  

Để mô hình hoàn tất một phần dữ liệu đầu vào

Mô hình ngôn ngữ tạo sinh hoạt động như một công cụ tự động hoàn thành nâng cao. Khi bạn cung cấp một phần nội dung, mô hình có thể cung cấp phần nội dung còn lại hoặc nội dung mà mô hình cho là nội dung tiếp tục của nội dung đó dưới dạng phản hồi. Khi bạn làm như vậy, nếu bạn đưa vào bất kỳ ví dụ hoặc ngữ cảnh nào, mô hình có thể tính đến những ví dụ hoặc ngữ cảnh đó.

Ví dụ sau đây cung cấp một câu lệnh có hướng dẫn và dữ liệu đầu vào về thực thể:

For the given order, return a JSON object that has the fields cheeseburger, hamburger, fries, or
drink, with the value being the quantity.

Order: A burger and a drink.
  
```
{
  "hamburger": 1,
  "drink": 1
}
```
  

Mặc dù mô hình đã làm theo lời nhắc, nhưng việc viết hướng dẫn bằng ngôn ngữ tự nhiên đôi khi có thể gây khó khăn và khiến mô hình phải diễn giải nhiều. Ví dụ: thực đơn của một nhà hàng có thể chứa nhiều mục. Để giảm kích thước của phản hồi JSON, bạn có thể muốn bỏ qua các mục không được sắp xếp. Trong trường hợp này, bạn có thể đưa ra một ví dụ và tiền tố phản hồi rồi để mô hình hoàn tất:

Valid fields are cheeseburger, hamburger, fries, and drink.
Order: Give me a cheeseburger and fries
Output:
```
{
  "cheeseburger": 1,
  "fries": 1
}
```
Order: I want two burgers, a drink, and fries.
Output:
  
```
{
  "hamburger": 2,
  "drink": 1,
  "fries": 1
}
```
  

Hãy lưu ý cách "bánh mì kẹp pho mát" bị loại trừ khỏi kết quả vì món này không có trong đơn đặt hàng.

Yêu cầu mô hình định dạng phản hồi

Chiến lược hoàn thành cũng có thể giúp định dạng phản hồi. Ví dụ sau đây nhắc mô hình tạo dàn ý cho bài luận:

Create an outline for an essay about hummingbirds.
  
  Hummingbirds: A Symphony of Speed and Color
    I. Introduction
    A. Hummingbirds are fascinating creatures known for their dazzling colors, lightning-fast flight, and unique feeding habits.
    B. Brief overview of the diversity of hummingbird species and their geographic distribution.
    C. Thesis statement: Hummingbirds are an embodiment of resilience, adaptation, and the wonders of the natural world.
.....
  

Lời nhắc không chỉ định định dạng cho dàn ý và mô hình đã chọn một định dạng cho bạn. Để mô hình trả về một bố cục ở một định dạng cụ thể, bạn có thể thêm văn bản đại diện cho phần đầu của bố cục và để mô hình hoàn tất dựa trên mẫu mà bạn đã khởi tạo.

Create an outline for an essay about hummingbirds.
I. Introduction
   *
  
  Hummingbirds: Jewels of the Air
    **I. Introduction**
       * **Hook:** Begin with a captivating image or anecdote about hummingbirds, emphasizing their vibrant colors, rapid flight, and unique feeding habits.
       * **Background:** Briefly introduce hummingbirds as the smallest birds in the world and their fascinating adaptations for a nectar-rich diet.
       * **Thesis:** State the main argument or focus of the essay. Examples: 
            * **The incredible adaptations of hummingbirds enable them to thrive in diverse ecosystems.**
            * **Hummingbirds play a crucial role in pollination and biodiversity.**
            * **The beauty and grace of hummingbirds make them captivating subjects for both scientific study and artistic appreciation.**
  

Tóm tắt

  • Nếu bạn cung cấp dữ liệu đầu vào một phần cho mô hình, mô hình sẽ hoàn tất dữ liệu đầu vào đó dựa trên mọi ví dụ hoặc ngữ cảnh có sẵn trong câu lệnh.
  • Đôi khi, việc yêu cầu mô hình hoàn thành một dữ liệu đầu vào có thể dễ dàng hơn so với việc mô tả tác vụ bằng ngôn ngữ tự nhiên.
  • Việc thêm một phần câu trả lời vào câu lệnh có thể hướng dẫn mô hình tuân theo một mẫu hoặc định dạng mong muốn.

Chia nhỏ câu lệnh thành các thành phần đơn giản

Đối với các trường hợp sử dụng yêu cầu lời nhắc phức tạp, bạn có thể giúp mô hình quản lý độ phức tạp này bằng cách chia nhỏ các thành phần thành các thành phần đơn giản hơn.

Hướng dẫn phân tích

Thay vì có nhiều hướng dẫn trong một câu lệnh, hãy tạo một câu lệnh cho mỗi hướng dẫn. Bạn có thể chọn lời nhắc cần xử lý dựa trên dữ liệu đầu vào của người dùng.

Chuỗi lời nhắc

Đối với các nhiệm vụ phức tạp liên quan đến nhiều bước tuần tự, hãy đặt mỗi bước thành một câu lệnh và nối các câu lệnh với nhau theo trình tự. Trong chuỗi lời nhắc tuần tự này, đầu ra của một lời nhắc trong trình tự sẽ trở thành đầu vào của lời nhắc tiếp theo. Kết quả của lời nhắc cuối cùng trong trình tự là kết quả cuối cùng.

Câu trả lời tổng hợp

Tổng hợp là khi bạn muốn thực hiện nhiều tác vụ song song trên nhiều phần dữ liệu và tổng hợp kết quả để tạo ra kết quả cuối cùng. Ví dụ: bạn có thể yêu cầu mô hình này thực hiện một thao tác trên phần đầu tiên của dữ liệu, thực hiện một thao tác khác trên phần dữ liệu còn lại và tổng hợp kết quả.

Tóm tắt

  • Chia các hướng dẫn phức tạp thành một lời nhắc cho mỗi hướng dẫn và quyết định lời nhắc nào sẽ được áp dụng dựa trên dữ liệu đầu vào của người dùng.
  • Chia nhiều bước tuần tự thành các câu lệnh riêng biệt và nối các câu lệnh đó sao cho kết quả của câu lệnh trước trở thành dữ liệu đầu vào của câu lệnh tiếp theo.
  • Chia nhỏ các nhiệm vụ song song và tổng hợp các câu trả lời để có kết quả cuối cùng.

Thử nghiệm với nhiều giá trị tham số

Mỗi lệnh gọi bạn gửi đến một mô hình sẽ bao gồm các giá trị tham số kiểm soát cách mô hình đó tạo một phản hồi. Mô hình có thể tạo ra nhiều kết quả cho nhiều giá trị tham số. Thử nghiệm với nhiều giá trị tham số để có được giá trị tốt nhất cho tác vụ. Các tham số dành cho các mô hình khác nhau có thể khác nhau. Sau đây là các tham số phổ biến nhất:

  • Số mã thông báo đầu ra tối đa
  • Nhiệt độ
  • Top-K
  • Top-P

Số mã thông báo đầu ra tối đa

Số lượng mã thông báo tối đa có thể được tạo trong phản hồi. Mã thông báo có khoảng bốn ký tự. 100 mã thông báo tương ứng với khoảng 20 từ.

Hãy chỉ định giá trị thấp hơn cho phản hồi ngắn hơn và giá trị cao hơn cho phản hồi dài hơn.

Nhiệt độ

Nhiệt độ được dùng để lấy mẫu trong quá trình tạo phản hồi, quá trình này xảy ra khi áp dụng topPtopK. Nhiệt độ kiểm soát mức độ ngẫu nhiên trong việc lựa chọn mã thông báo. Nhiệt độ thấp hơn phù hợp với các câu lệnh yêu cầu phản hồi có tính quyết định hơn và ít mở hơn hoặc sáng tạo hơn, trong khi nhiệt độ cao hơn có thể dẫn đến kết quả đa dạng hơn hoặc sáng tạo hơn. Nhiệt độ 0 có tính xác định, nghĩa là phản hồi xác suất cao nhất luôn được chọn.

Đối với hầu hết các trường hợp sử dụng, hãy thử bắt đầu ở mức nhiệt độ 0.2. Nếu mô hình trả về phản hồi quá chung chung, quá ngắn hoặc mô hình đưa ra phản hồi dự phòng, hãy thử tăng nhiệt độ.

Top-K

Top-K thay đổi cách mô hình chọn mã thông báo cho đầu ra. K-top là 1 có nghĩa là mã thông báo được chọn tiếp theo là mã thông báo có nhiều khả năng nhất trong số tất cả các mã thông báo trong từ vựng của mô hình (còn gọi là giải mã tham lam), trong khi K-top là 3 có nghĩa là mã thông báo tiếp theo được chọn trong số 3 mã thông báo có nhiều khả năng nhất bằng cách sử dụng nhiệt độ.

Đối với mỗi bước chọn mã thông báo, các mã thông báo hàng đầu có xác suất cao nhất sẽ được lấy mẫu. Sau đó, các mã thông báo được lọc thêm dựa trên P hàng đầu, trong đó mã thông báo cuối cùng được chọn bằng cách lấy mẫu nhiệt độ.

Chỉ định giá trị thấp hơn để có ít câu trả lời ngẫu nhiên hơn và giá trị cao hơn để có nhiều câu trả lời ngẫu nhiên hơn. K hàng đầu mặc định là 40.

Top-P

P hàng đầu thay đổi cách mô hình chọn mã thông báo cho đầu ra. Các mã thông báo được chọn từ nhiều khả năng nhất (xem top-K) đến ít khả năng nhất cho đến khi tổng xác suất của các mã thông báo bằng giá trị top-P. Ví dụ: nếu mã thông báo A, B và C có xác suất là 0, 3, 0, 2 và 0, 1 và giá trị P hàng đầu là 0.5, thì mô hình sẽ chọn A hoặc B làm mã thông báo tiếp theo bằng cách sử dụng nhiệt độ và loại trừ C làm đề xuất.

Chỉ định giá trị thấp hơn để có ít câu trả lời ngẫu nhiên hơn và giá trị cao hơn để có nhiều câu trả lời ngẫu nhiên hơn. P trên cùng mặc định là 0.95.

Chiến lược lặp lại lời nhắc

Thiết kế câu lệnh là một quá trình lặp lại, thường yêu cầu vài lần lặp lại trước khi bạn nhận được phản hồi mong muốn một cách nhất quán. Phần này hướng dẫn một số điều bạn có thể thử khi lặp lại các câu lệnh.

Sử dụng cách diễn đạt khác

Việc sử dụng các từ hoặc cụm từ khác nhau trong câu lệnh thường dẫn đến các câu trả lời khác nhau từ mô hình mặc dù tất cả đều có cùng ý nghĩa. Nếu bạn không nhận được kết quả mong muốn từ câu lệnh, hãy thử diễn đạt lại theo cách khác.

Version 1:
How do I bake a pie?

Version 2:
Suggest a recipe for a pie.

Version 3:
What's a good pie recipe?
  

Chuyển sang một tác vụ tương tự

Nếu bạn không thể yêu cầu mô hình làm theo hướng dẫn của bạn cho một nhiệm vụ, hãy thử đưa ra hướng dẫn cho một nhiệm vụ tương tự để đạt được kết quả tương tự.

Lời nhắc này yêu cầu mô hình phân loại sách bằng cách sử dụng các danh mục được xác định trước.

Which category does The Odyssey belong to:
thriller
sci-fi
mythology
biography
  
    The Odyssey belongs to the category of **mythology**. 

    Here's why:
    
    * **Mythology:** The Odyssey tells the story of Odysseus, a hero from Greek mythology, and his
    journey home after the Trojan War. It features gods, monsters, and supernatural events common to
    Greek mythology.
.....
  

Phản hồi là chính xác, nhưng mô hình không nằm trong giới hạn của các tuỳ chọn. Bạn cũng nên chỉ trả lời bằng một trong các lựa chọn thay vì một câu đầy đủ. Trong trường hợp này, bạn có thể diễn đạt lại hướng dẫn dưới dạng câu hỏi trắc nghiệm và yêu cầu mô hình chọn một lựa chọn.

Multiple choice problem: Which of the following options describes the book The Odyssey?
Options:
- thriller
- sci-fi
- mythology
- biography
  
The correct answer is **mythology**. 
  

Thay đổi thứ tự nội dung của lời nhắc

Đôi khi, thứ tự nội dung trong câu lệnh có thể ảnh hưởng đến câu trả lời. Hãy thử thay đổi thứ tự nội dung và xem thứ tự đó ảnh hưởng như thế nào đến phản hồi.

Version 1:
[examples]
[context]
[input]

Version 2:
[input]
[examples]
[context]

Version 3:
[examples]
[input]
[context]

Phản hồi dự phòng

Phản hồi dự phòng là phản hồi do mô hình trả về khi câu lệnh hoặc phản hồi kích hoạt bộ lọc an toàn. Ví dụ về phản hồi dự phòng: "Tôi không thể giúp bạn về việc đó vì tôi chỉ là một mô hình ngôn ngữ".

Nếu mô hình phản hồi bằng một phản hồi dự phòng, hãy thử tăng nhiệt độ.

Những điều nên tránh

  • Tránh dựa vào mô hình để tạo thông tin thực tế.
  • Hãy cẩn thận khi sử dụng đối với các bài toán toán học và logic.

Các bước tiếp theo