Chiến lược nhắc tệp

Dòng mô hình trí tuệ nhân tạo (AI) Gemini được xây dựng để xử lý nhiều loại dữ liệu đầu vào, bao gồm cả văn bản, hình ảnh và âm thanh. Vì các mô hình này có thể xử lý nhiều loại hoặc chế độ dữ liệu, nên các mô hình Gemini được gọi là mô hình đa phương thức hoặc được giải thích là có khả năng đa phương thức.

Trang này cung cấp hướng dẫn và các phương pháp hay nhất để sử dụng tệp nội dung nghe nhìn với lời nhắc cho API Gemini. Để biết thông tin về cách sử dụng API tệp Gemini nhằm tải tệp đa phương tiện lên và đưa tệp đa phương tiện vào câu lệnh của bạn, hãy xem phần Nhắc nhở với tệp đa phương tiện.

Sử dụng tệp nội dung nghe nhìn theo lời nhắc

Việc có thể sử dụng nhiều loại dữ liệu trong câu lệnh sẽ giúp bạn linh hoạt hơn về những công việc có thể xử lý thông qua API Gemini. Ví dụ: bạn có thể gửi cho mô hình hình ảnh về một bữa ăn ngon và yêu cầu mô hình đó viết một blog ngắn về bữa ăn.

Lời nhắc Đáp

Viết một bài đăng ngắn và hấp dẫn trên blog dựa trên ảnh này. Chú thích phải bao gồm nội dung mô tả bữa ăn trong ảnh và nói về công việc chuẩn bị bữa ăn trên hành trình của tôi.


Bánh quy

Chuẩn bị bữa ăn là một cách tuyệt vời để tiết kiệm thời gian, tiền bạc, đồng thời giúp bạn ăn uống lành mạnh hơn. Bữa ăn này là một ví dụ tuyệt vời về một bữa ăn lành mạnh và ngon miệng có thể dễ dàng được chuẩn bị trước.

Bữa ăn này gồm cơm nâu, rau củ nướng và sốt teriyaki từ gà. Gạo lứt là một loại carbohydrate lành mạnh và phức tạp, cung cấp cho bạn năng lượng bền vững. Rau nướng là một cách tuyệt vời để bổ sung vitamin và khoáng chất hằng ngày, trong khi sốt teriyaki từ gà là một lựa chọn ngon và giàu đạm.

Bữa ăn này cũng rất dễ chuẩn bị. Bạn chỉ cần nấu cơm gạo lức, quay rau củ và nấu sốt teriyaki gà. Sau khi mọi thứ nấu xong, hãy chia vào các hộp đựng thức ăn và bảo quản trong tủ lạnh. Sau đó, bạn có thể lấy một chiếc thùng chứa và tiếp tục vào những buổi sáng bận rộn!

Nếu bạn đang tìm một bữa ăn lành mạnh và ngon miệng có thể dễ dàng chuẩn bị trước, thì bữa ăn này là lựa chọn tuyệt vời. Loại thực phẩm này chứa nhiều chất dinh dưỡng và hương vị, đảm bảo sẽ mang lại cho bạn cảm giác no và hài lòng.

Mời bạn chuẩn bị một bữa ăn ngon và lành mạnh!

Chiến lược đưa ra lời nhắc bằng nội dung nghe nhìn

Nếu gặp vấn đề khi nhận kết quả mong muốn từ các lời nhắc sử dụng tệp nội dung nghe nhìn, bạn có thể tham khảo một số chiến lược có thể giúp mình nhận được kết quả mong muốn. Các phần sau đây cung cấp các phương pháp thiết kế và mẹo khắc phục sự cố để cải thiện những câu lệnh sử dụng phương thức nhập đa phương thức.

Bạn có thể cải thiện lời nhắc đa phương thức bằng cách làm theo các phương pháp hay nhất sau đây:

Kiến thức cơ bản về thiết kế lời nhắc

  • Đưa ra hướng dẫn cụ thể: Hãy viết hướng dẫn rõ ràng và súc tích để tránh gây hiểu nhầm.
  • Thêm một vài ví dụ vào câu lệnh của bạn: Sử dụng các ví dụ thực tế chụp bằng một vài cảnh để minh hoạ những gì bạn muốn đạt được.
  • Chia nhỏ từng bước: Chia các nhiệm vụ phức tạp thành các mục tiêu phụ có thể quản lý, hướng dẫn mô hình xuyên suốt quá trình.
  • Chỉ định định dạng đầu ra: Trong câu lệnh của bạn, hãy yêu cầu đầu ra ở định dạng bạn muốn, như markdown, JSON, HTML và các định dạng khác.
  • Đặt hình ảnh của bạn lên đầu tiên cho các câu lệnh có một hình ảnh: Mặc dù Gemini có thể xử lý các câu lệnh nhập hình ảnh và văn bản theo thứ tự bất kỳ, nhưng đối với các câu lệnh chứa một hình ảnh đơn lẻ, nó có thể hoạt động hiệu quả hơn nếu hình ảnh đó được đặt trước câu lệnh dạng văn bản.

    Khắc phục sự cố với lời nhắc đa phương thức

    • Nếu mô hình không vẽ thông tin từ phần liên quan của hình ảnh: Thả gợi ý về khía cạnh của hình ảnh mà bạn muốn lời nhắc vẽ thông tin.
    • Nếu đầu ra của mô hình quá chung chung (không đủ điều chỉnh cho phù hợp với hình ảnh): Ở đầu câu lệnh, hãy thử yêu cầu mô hình mô tả(các) hình ảnh trước khi đưa ra hướng dẫn tác vụ, hoặc thử yêu cầu mô hình tham chiếu đến nội dung trong hình ảnh.
    • Nguyên tắc cơ bản về thiết kế lời nhắc

      Phần này mở rộng về các phương pháp hay nhất được liệt kê trong phần trước.

      Lưu ý: Kết quả mô hình trong các ví dụ sau đây về Gemini có thể khác nhau giữa các lần chạy.

      Hãy nêu cụ thể trong hướng dẫn của bạn

      Lời nhắc mang lại thành công nhất khi luôn rõ ràng và chi tiết. Nếu muốn có một kết quả cụ thể, bạn nên đưa yêu cầu đó vào lời nhắc để đảm bảo nhận được kết quả mong muốn.

      Đôi khi, người viết câu lệnh có thể thấy ý định rõ ràng, nhưng thực tế thì ý định đó chưa được chỉ định cụ thể. Để tuỳ chỉnh hành vi của mô hình, hãy cân nhắc cách diễn giải (sai) câu lệnh của bạn và đảm bảo rằng các hướng dẫn bạn đưa ra đều cụ thể và rõ ràng. Hãy nhớ để trống tối đa chỗ để hiểu nhầm

      Đối với hình ảnh bảng điều khiển sân bay này, việc yêu cầu mô hình chỉ "mô tả hình ảnh này" có thể tạo ra một nội dung mô tả chung. Nếu cần mô hình này để phân tích cú pháp thời gian và thành phố trong hình ảnh, bạn có thể trực tiếp đưa yêu cầu đó vào câu lệnh của mình.

      Câu lệnh Phản hồi của mô hình

      Mô tả hình ảnh này.

      Hình ảnh thể hiện bảng thông tin về sân bay và giờ khởi hành.

      Đã cập nhật lời nhắc Cải thiện câu trả lời
      Lịch trình cho chuyến đi

      Phân tích cú pháp thời gian và thành phố trên bảng thông tin sân bay trong hình ảnh này thành một danh sách.

    • 10:50 Mát-xcơ-va
    • 11:05 tại Scotland
    • 11:05 London
    • 11:10 Bucharest
    • 11:30 Kiev
    • 11:35 Dublin
    • 11:45 Đông Midlands
    • 12:15 Sofia
    • 12:30 giờ London
    • 12:30 Newcastle
    • 12:40 giờ St.
    • 12:40 London
    • 12:45 Manchester
    • Thêm một vài ví dụ

      Mô hình Gemini có thể chấp nhận nhiều dữ liệu đầu vào mà nó có thể dùng làm ví dụ để hiểu được kết quả bạn muốn. Việc thêm những ví dụ này có thể giúp mô hình xác định các mẫu và áp dụng mối quan hệ giữa các hình ảnh và phản hồi đã cho cho ví dụ mới. Quá trình này còn gọi là quá trình học "một vài lần".

      Trong ví dụ bên dưới, kết quả đầu ra ban đầu được viết ở dạng câu và cũng chứa quốc gia (Brazil). Giả sử bạn muốn kết quả ở một định dạng hoặc kiểu khác và bạn chỉ muốn thành phố chứ không muốn quốc gia. Việc thêm ví dụ vài cảnh vào câu lệnh của bạn có thể điều khiển mô hình phản hồi theo cách bạn muốn.

      Lời nhắc Phản hồi của mô hình
      Lịch trình cho chuyến đi

      Xác định thành phố cùng với địa danh.

      Địa điểm nổi tiếng là tượng Chúa Ki-tô Cứu thế ở Rio de Janeiro, Brazil.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

      Xác định thành phố cùng với địa danh.

      đấu trường

      thành phố: Rome, địa danh: Đấu trường La Mã.

      Tử Cấm Thành

      Thành phố: Bắc Kinh, mốc: Tử Cấm Thành

      thành phố bị cấm

      thành phố: Rio de Janeiro, địa danh: tượng Chúa Cứu thế

      Chia nhỏ theo từng bước

      Đối với các nhiệm vụ phức tạp như những nhiệm vụ đòi hỏi khả năng hiểu và lập luận bằng hình ảnh, bạn nên chia nhiệm vụ đó thành các bước nhỏ và đơn giản hơn. Ngoài ra, cách này cũng có thể hiệu quả nếu bạn trực tiếp yêu cầu mô hình "suy nghĩ từng bước" trong câu lệnh của mình.

      Câu lệnh Phản hồi của mô hình

      Khi nào tôi sẽ hết giấy vệ sinh?

      Sắp tới, bạn chỉ còn 3 lượt đổ xúc xắc.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

        1. Trước tiên, hãy đếm xem có bao nhiêu cuộn giấy vệ sinh trong ảnh này.
        2. Sau đó, hãy xác định lượng giấy vệ sinh mà một người thông thường sử dụng mỗi ngày.
        3. Tính toán xem những cuộn giấy vệ sinh này sẽ tồn tại trong bao lâu.

        1. Trong ảnh này có 3 cuộn giấy vệ sinh.
        2. Một người thông thường sử dụng khoảng 20 tờ giấy vệ sinh mỗi ngày.
        3. Nếu mỗi cuộn chứa 200 tờ thì mỗi cuộn sẽ kéo dài trong khoảng 10 ngày. Như vậy, 3 lượt đổ xúc xắc sẽ kéo dài trong khoảng một tháng.

      Bài toán hoặc các dạng bài toán đố khác là những đề xuất tuyệt vời để yêu cầu mô hình tư duy theo từng bước.

      Lời nhắc Đáp

      Số hạng thứ 4 trong dãy là gì?

      -135

      Phản hồi từ mô hình không chính xác. Một số cách để cải thiện vấn đề này là yêu cầu mô hình phân tích cú pháp vấn đề trước khi trả lời lời nhắc.

      Lời nhắc Đáp

      Trước tiên, hãy phân tích cú pháp công thức trong hình ảnh.

      Sau đó, dựa vào công thức, hãy trả lời "số hạng thứ 4 trong chuỗi là gì?".

      Nhấp để mở rộng kết quả

      $$ b(n) = b(n-1) * (-3) $$

      $$ b(1) = 15 $$

      1. Thay n = 4 vào công thức:
      2. $$ b(4) = b(4-1) * (-3) $$

        $$ b(4) = b(3) * (-3) $$

      3. Chúng tôi không biết giá trị của b(3), vì vậy thay n = 3 vào công thức:
      4. $$ b(3) = b(3-1) * (-3) $$

        $$ b(3) = b(2) * (-3) $$

      5. Chúng tôi không biết giá trị của b(2), vì vậy thay n = 2 vào công thức:
      6. $$ b(2) = b(2-1) * (-3) $$

        $$ b(2) = b(1) * (-3) $$

      7. Chúng ta biết giá trị của b(1) là 15, vì vậy thay nó vào công thức:
      8. $$ b(2) = 15 * (-3) $$

        $$ b(2) = -45 $$

      9. Bây giờ chúng ta đã biết giá trị của b(2), hãy thay nó vào công thức b(3):
      10. $$ b(3) = b(2) * (-3) $$

        $$ b(3) = -45 * (-3) $$

        $$ b(3) = 135 $$

      11. Bây giờ chúng ta đã biết giá trị của b(3), phép thay nó vào công thức b(4):
      12. $$ b(4) = b(3) * (-3) $$

        $$ b(4) = 135 * (-3) $$

        $$ b(4) = -405 $$

      Do đó, số hạng thứ 4 trong dãy là -405.

      Câu trả lời của mô hình này là chính xác. Giờ đây, để giúp câu trả lời trở nên đơn giản hơn, bạn có thể yêu cầu mô hình suy nghĩ theo từng bước.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

      Số hạng thứ 4 trong dãy là gì? Hãy suy nghĩ theo từng bước.

      Số hạng đầu tiên là 15.

      Số hạng thứ hai là b(1) * (-3) = 15 * (-3) = -45.

      Số hạng thứ ba là b(2) * (-3) = -45 * (-3) = 135.

      Số hạng thứ tư là b(3) * (-3) = 135 * (-3) = -405.

      Thử chỉ định định dạng đầu ra

      Một vấn đề phổ biến là cần đầu ra của mô hình ở một định dạng nhất định (ví dụ: markdown, JSON, HTML), đặc biệt là nếu đầu ra mô hình cần được nhập từ tác vụ truyền xuống. Bạn có thể cố gắng tạo đầu ra ở định dạng đó bằng cách hướng dẫn mô hình thực hiện việc này trong câu lệnh. Dưới đây là hai ví dụ:

      Câu lệnh Phản hồi của mô hình

      Phân tích cú pháp bảng trong hình ảnh này sang định dạng markdown

      | Tiêu đề | Trạng thái | Thời gian | Ngày bắt đầu | Đến hạn vào |

      | ------- | ------ | ---- | --------- | ------ |

      | Math | Done | 1,5 giờ | 29/11/2023 | 1/12/2023 |

      | Địa lý | Xong | 30 phút | 2/12/2023 | 4/12/2023 |

      | Vật lý | Đang tiến hành | 2 giờ | 12/3/2023 | 12/5/2023 |

      | Sinh học | Chưa bắt đầu | 6 giờ | 2/11/2016 | 6/12/2023 |

      Lời nhắc Phản hồi của mô hình

      Cung cấp một danh sách gồm tất cả các thuộc tính sau:

      nguyên liệu, loại món ăn, món chay hay không, ở định dạng JSON

      ```json```

      {

      "ingredients": [

      "rice",

      "shrimp",

      "clams",

      "mussels",

      "peas",

      "tomatoes",

      "onions",

      "garlic",

      "olive oil",

      "paprika",

      "salt",

      "pepper"

      ],

      "type of cuisine": "Spanish",

      "vegetarian": false

      Đặt hình ảnh của bạn lên đầu tiên cho lời nhắc chỉ có một hình ảnh

      Mặc dù Gemini có thể diễn giải hình ảnh và văn bản theo thứ tự bất kỳ trong câu lệnh, nhưng việc đặt một hình ảnh trước lời nhắc văn bản có thể mang lại kết quả tốt hơn. Trong các mẫu sau, bạn sẽ thấy hình ảnh xuất hiện trước văn bản trong mỗi câu lệnh.

      Khắc phục sự cố với lời nhắc đa phương thức

      Bạn có thể cần khắc phục sự cố đối với lời nhắc nếu không nhận được câu trả lời hữu ích. Dưới đây là một vài chiến lược bạn có thể thử.

      Nếu mô hình không vẽ thông tin từ phần liên quan của hình ảnh

      Để nhận được câu trả lời cụ thể hơn, bạn có thể chỉ ra khía cạnh nào của hình ảnh mà bạn muốn lời nhắc vẽ thông tin từ đó để cung cấp thông tin cho phản hồi.

      Câu lệnh Phản hồi của mô hình

      Những chiếc tã này sẽ dùng cho em bé được bao nhiêu ngày?

      Tã sẽ tồn tại trong 198 ngày rồi mới hết tã.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

      Dùng được bao lâu nữa trước khi tôi hết tã?

      Sử dụng trọng lượng nêu trên hộp để xác định độ tuổi của trẻ và sử dụng tổng số lượng tã có trong hộp.

      Chia tổng số cho số lượng tã mà trẻ phải trải qua mỗi ngày.

      Hộp chứa 198 tã. Hộp có ghi tã dành cho một đứa trẻ nặng từ 22 đến 37 pao.

      Đứa trẻ trung bình trong phạm vi cân nặng này có thể nằm trong khoảng từ 1 đến 2 tuổi.

      Một đứa trẻ 2 tuổi thường phải trải qua 6 tã mỗi ngày, do đó, tã sẽ kéo dài khoảng 33 ngày (198/6).

      Nếu đầu ra của mô hình quá chung chung và không đủ điều chỉnh cho phù hợp với đầu vào hình ảnh

      Để giúp mô hình điều chỉnh phản hồi cho phù hợp với(các) hình ảnh, hãy thử yêu cầu mô tả hình ảnh trước khi thực hiện lý do.

      Câu lệnh Phản hồi của mô hình

      Điểm chung giữa những hình ảnh này là gì?

      Cả 4 hình ảnh này đều là ví dụ về ảnh phong cảnh.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

      Đầu tiên, hãy mô tả chi tiết nội dung của mỗi hình ảnh. Những hình ảnh này có điểm gì chung?

      Hình ảnh đầu tiên là một người đang đóng gói vali. Hình ảnh thứ hai cho thấy một hành lang trống trong một trung tâm mua sắm. Hình ảnh thứ ba là một cuộn giấy vệ sinh. Hình ảnh thứ tư cho thấy một biển sẫm màu và bão bùng.

      Điểm chung giữa các hình ảnh này là tất cả đều là ví dụ về không gian tim. Khoảng trống là những địa điểm hoặc tình huống nằm giữa hai vị trí hoặc tình huống khác. Họ thường được đặc trưng bởi cảm giác không chắc chắn hoặc không rõ ràng.

      Hình ảnh đầu tiên cho thấy một người đang ở trong nhà và đang đi du lịch. Hình ảnh thứ hai cho thấy hành lang ở giữa hai cửa hàng. Hình ảnh thứ ba là giấy vệ sinh, có thể tượng trưng cho phòng tắm. Phòng tắm là không gian chuyển tiếp giữa không gian riêng tư và công cộng. Đó là nơi chúng ta chuẩn bị để bước vào hoặc rời khỏi thế giới bên ngoài.

      Hình ảnh thứ tư cho thấy biển ở giữa đang bình yên và có bão.

      Không gian thư thái có thể vừa thú vị vừa bất ổn. Đó có thể là nơi khởi đầu mới hoặc là nơi kết thúc. Đó có thể là nơi suy ngẫm hoặc hành động.

      Bạn cũng có thể thử yêu cầu mô hình tham chiếu đến nội dung trong hình ảnh một cách rõ ràng.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

      Điểm chung giữa những hình ảnh này là gì? Tham khảo nội dung hình ảnh trong câu trả lời của bạn.

      Tất cả hình ảnh đều liên quan đến du lịch. Hình ảnh đầu tiên cho thấy một người đang đóng gói vali, hình ảnh thứ hai cho thấy một hành lang trống rỗng trong một trung tâm mua sắm, hình ảnh thứ ba cho thấy một chồng giấy vệ sinh, và hình ảnh thứ tư cho thấy một biển cả tối tăm và bão táp.

      Những hình ảnh này đều liên quan đến du lịch vì đó là mọi thứ mà mọi người cần hoặc sử dụng khi đi du lịch. Hình ảnh đầu tiên cho thấy một người đang đóng gói vali. Mọi người thường làm khi trong một chuyến du lịch. Hình ảnh thứ hai cho thấy một hành lang trống trong một trung tâm mua sắm, nơi mọi người thường đến để mua đồ cho chuyến đi của họ. Hình ảnh thứ ba cho thấy một chồng giấy vệ sinh, loại giấy vệ sinh mà mọi người thường sử dụng khi đi du lịch. Hình ảnh thứ tư cho thấy một biển sóng tối tăm và đầy bão, mà mọi người thường bắt gặp khi đi du lịch.

      Các mẹo tương tự cũng áp dụng cho kết quả mẫu quảng cáo từ hình ảnh. Trong ví dụ sau về thỏ, bạn có thể cải thiện kết quả bằng cách yêu cầu mô hình đưa vào các khía cạnh trong hình ảnh một cách rõ ràng.

      Câu lệnh Phản hồi của mô hình

      Bạn có thể viết cho tôi một bài thơ về hình ảnh này không?

      Chú thỏ nhỏ, thật mềm và có màu nâu,
      Nhảy qua cánh đồng, lên và xuống.
      Tai của bạn dài quá, cái đuôi nhỏ thật.
      Bạn là sinh vật đáng yêu nhất trong số tất cả những người bạn này.

      Bạn gặm cỏ, thật ngọt ngào và xanh tươi
      Rồi bay đi khi thấy tôi.
      Nhưng tôi sẽ luôn là bạn của bạn,
      Thỏ nhỏ, cho đến cuối cùng.

      Đã cập nhật lời nhắc Cải thiện câu trả lời

      Bạn có thể viết cho tôi một bài thơ mô tả và gây ấn tượng mạnh về bức ảnh này kèm theo địa điểm được không?

      Thỏ nhỏ màu xanh lục,
      Tai quá dài, rất nhạy.
      Bạn thấy gì ở ngoài kia,
      Ở phía xa, bạn nhìn chăm chú?

      Có phải là màu xanh đại dương không,
      Lấp lánh trong sắc màu của mặt trời?
      Hay là những con sóng vỗ rầm rĩ,
      Một nhịp điệu mà bạn yêu mến?

      Thỏ nhỏ, nói cho tôi biết thật nhé,
      Điều gì thu hút sự chú ý của bạn đến vậy?
      Có phải gió mặn,
      Hay tiếng chim hải âu khóc?

      Có lẽ do sự rộng lớn của thế giới,
      Một thế giới thật lớn và nhỏ.
      Nơi chắp cánh ước mơ,
      cùng những cuộc phiêu lưu mà ai cũng có thể gieo.

      Thỏ nhỏ ơi, tôi tự hỏi giấc mơ của bạn là gì!
      Khi bạn ngồi trên bãi cỏ, thanh bình vô cùng.
      Bạn có khao khát khám phá vùng trầm không,
      Hay ở lại trên mặt đất, bạn có thể nhảy xuống?

      Dù là gì đi nữa, bạn bé thỏ,
      Hãy giữ cho ánh sáng kỳ diệu đó luôn cháy bỏng.
      Trong giấc mơ và khát vọng của bạn,
      Cả thế giới chờ đón tác phẩm của bạn.

      Khắc phục vấn đề không đáp ứng được phần nào của lời nhắc

      Có thể bạn sẽ khó mà biết được liệu một câu lệnh có lỗi do mô hình không hiểu hình ảnh khi bắt đầu, hay đã hiểu hình ảnh nhưng không thực hiện các bước lập luận chính xác sau đó.

      Để phân biệt những lý do đó, hãy yêu cầu mô hình mô tả nội dung trong hình ảnh.

      Trong ví dụ dưới đây, nếu mô hình phản hồi bằng một món ăn vặt có vẻ gây ngạc nhiên khi đi kèm với trà (ví dụ: bỏng ngô), thì trước tiên bạn có thể khắc phục sự cố để xác định xem mô hình có nhận dạng chính xác hình ảnh chứa trà hay không.

      Câu lệnh Lời nhắc khắc phục sự cố

      Tôi có thể làm món ăn gì trong 1 phút mà hợp với món này?

      Mô tả nội dung trong hình ảnh này.

      Một chiến lược khác là yêu cầu mô hình giải thích lý do. Điều đó có thể giúp bạn thu hẹp phần nào của lý do bị hỏng, nếu có.

      Câu lệnh Lời nhắc khắc phục sự cố

      Tôi có thể làm món ăn gì trong 1 phút mà hợp với món này?

      Tôi có thể làm món ăn gì trong 1 phút mà hợp với món này? Vui lòng giải thích lý do.

      Điều chỉnh tham số lấy mẫu

      Trong mỗi yêu cầu, bạn không chỉ gửi lời nhắc đa phương thức, mà còn gửi một nhóm tham số lấy mẫu đến mô hình. Mô hình có thể tạo ra kết quả riêng cho từng giá trị tham số. Hãy thử nghiệm với các thông số khác nhau để nhận được giá trị tốt nhất cho tác vụ này. Sau đây là các thông số thường được điều chỉnh nhất:

      • Nhiệt độ
      • đầu-P
      • đầu-K

      Nhiệt độ

      Nhiệt độ được dùng để lấy mẫu trong quá trình tạo phản hồi, xảy ra khi áp dụng đỉnh P và top-K. Nhiệt độ kiểm soát mức độ ngẫu nhiên của việc lựa chọn mã thông báo. Nhiệt độ thấp hơn phù hợp với các câu lệnh đòi hỏi câu lệnh đòi hỏi câu trả lời sáng tạo hoặc mang tính xác định hơn và ít mang tính mở hoặc hơn. Trong khi đó, nhiệt độ cao hơn có thể dẫn đến kết quả đa dạng hoặc sáng tạo hơn. Nhiệt độ 0 là tính xác định, nghĩa là phản hồi có khả năng cao nhất luôn được chọn.

      Đối với hầu hết các trường hợp sử dụng, hãy thử bắt đầu với nhiệt độ ở mức 0,4. Nếu bạn cần nhiều kết quả sáng tạo hơn, hãy thử tăng nhiệt độ. Nếu bạn nhận thấy ảo tưởng rõ ràng, hãy thử giảm nhiệt độ.

      Đầu trang

      Top-K thay đổi cách mô hình chọn mã thông báo cho đầu ra. Với top K là 1, tức là mã được chọn tiếp theo là mã có nhiều khả năng xuất hiện nhất trong số tất cả các mã thông báo trong từ vựng của mô hình (còn gọi là giải mã tham gia), trong khi đỉnh K là 3 có nghĩa là mã thông báo tiếp theo được chọn trong số 3 mã thông báo có nhiều khả năng xuất hiện nhất dựa trên nhiệt độ.

      Đối với mỗi bước chọn mã thông báo, những mã thông báo thuộc nhóm K hàng đầu có xác suất cao nhất sẽ được lấy mẫu. Sau đó, các mã thông báo được lọc thêm dựa trên P trên cùng với mã thông báo cuối cùng được chọn bằng cách sử dụng phương pháp lấy mẫu nhiệt độ.

      Chỉ định giá trị thấp hơn cho ít phản hồi ngẫu nhiên hơn và giá trị cao hơn cho nhiều phản hồi ngẫu nhiên hơn. Giá trị mặc định của top-K là 32.

      Bàn thắng

      Top-P thay đổi cách mô hình chọn mã thông báo cho đầu ra. Các mã thông báo được chọn từ mức có khả năng xuất hiện cao nhất (xem chữ cái đầu-K) đến ít khả năng nhất cho đến khi tổng xác suất của chúng bằng giá trị P cao nhất. Ví dụ: nếu mã thông báo A, B và C có xác suất là 0, 6; 0, 3; 0, 1 và giá trị P cao nhất là 0, 9, thì mô hình sẽ chọn A hoặc B làm mã thông báo tiếp theo bằng cách sử dụng nhiệt độ và loại C làm đề xuất.

      Chỉ định giá trị thấp hơn cho ít phản hồi ngẫu nhiên hơn và giá trị cao hơn cho nhiều phản hồi ngẫu nhiên hơn. Giá trị mặc định của top-P là 1,0.

      Các bước tiếp theo