Gemini 2.5 Pro Experimental, mô hình tiên tiến nhất của chúng tôi, hiện đã ra mắt! Tìm hiểu thêm

Trang này được dịch bởi Cloud Translation API.

Question answering

API Truy xuất ngữ nghĩa cung cấp dịch vụ trả lời câu hỏi được lưu trữ để xây dựng hệ thống Tạo dữ liệu tăng cường bằng tính năng truy xuất (RAG) bằng cơ sở hạ tầng của Google.

Phương thức: models.generateAnswer

Điểm cuối
Thông số đường dẫn
Nội dung yêu cầu
- Biểu diễn dưới dạng JSON
Nội dung phản hồi
- Biểu diễn dưới dạng JSON
Phạm vi uỷ quyền
GroundingPassages
- Biểu diễn dưới dạng JSON
GroundingPassage
- Biểu diễn dưới dạng JSON
SemanticRetrieverConfig
- Biểu diễn dưới dạng JSON
AnswerStyle
InputFeedback
- Biểu diễn dưới dạng JSON
BlockReason

Tạo câu trả lời dựa trên thực tế từ mô hình dựa trên dữ liệu đầu vào GenerateAnswerRequest.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{model=models/*}:generateAnswer

Tham số đường dẫn

model string

Bắt buộc. Tên của Model dùng để tạo câu trả lời dựa trên ngữ cảnh.

Định dạng: model=models/{model}. Phương thức này có dạng models/{model}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Trường

contents[] object (Content)

Bắt buộc. Nội dung của cuộc trò chuyện hiện tại với Model. Đối với truy vấn một lượt, đây là một câu hỏi duy nhất cần trả lời. Đối với các truy vấn nhiều lượt, đây là trường lặp lại chứa nhật ký trò chuyện và Content gần đây nhất trong danh sách chứa câu hỏi.

Lưu ý: models.generateAnswer chỉ hỗ trợ các cụm từ tìm kiếm bằng tiếng Anh.

answerStyle enum (AnswerStyle)

Bắt buộc. Kiểu trả về câu trả lời.

safetySettings[] object (SafetySetting)

Không bắt buộc. Danh sách các thực thể SafetySetting duy nhất để chặn nội dung không an toàn.

Điều này sẽ được thực thi trên GenerateAnswerRequest.contents và GenerateAnswerResponse.candidate. Không được có nhiều chế độ cài đặt cho mỗi loại SafetyCategory. API sẽ chặn mọi nội dung và phản hồi không đáp ứng các ngưỡng do các chế độ cài đặt này đặt ra. Danh sách này ghi đè chế độ cài đặt mặc định cho mỗi SafetyCategory được chỉ định trong safetySettings. Nếu không có SafetySetting cho một SafetyCategory nhất định được cung cấp trong danh sách, thì API sẽ sử dụng chế độ cài đặt an toàn mặc định cho danh mục đó. Các danh mục gây hại HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT được hỗ trợ. Hãy tham khảo hướng dẫn để biết thông tin chi tiết về các chế độ cài đặt an toàn hiện có. Ngoài ra, hãy tham khảo Hướng dẫn về an toàn để tìm hiểu cách đưa các yếu tố an toàn vào ứng dụng AI của bạn.

grounding_source Union type

Nguồn để dựa vào khi trả lời. grounding_source chỉ có thể là một trong những loại sau:

inlinePassages object (GroundingPassages)

Các đoạn văn bản được cung cấp cùng dòng với yêu cầu.

semanticRetriever object (SemanticRetrieverConfig)

Nội dung được truy xuất từ các tài nguyên được tạo thông qua API Trình truy xuất ngữ nghĩa.

temperature number

Không bắt buộc. Kiểm soát tính ngẫu nhiên của kết quả.

Giá trị có thể nằm trong khoảng [0,1]. Giá trị gần với 1.0 sẽ tạo ra các câu trả lời đa dạng và sáng tạo hơn, trong khi giá trị gần với 0.0 thường sẽ dẫn đến các câu trả lời đơn giản hơn từ mô hình. Bạn thường nên sử dụng nhiệt độ thấp (~0,2) cho các trường hợp sử dụng Trả lời câu hỏi được phân bổ.

Nội dung phản hồi

Phản hồi của mô hình cho câu trả lời có căn cứ.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Trường

answer object (Candidate)

Câu trả lời đề xuất của mô hình.

Lưu ý: Mô hình luôn cố gắng đưa ra câu trả lời có căn cứ, ngay cả khi câu trả lời đó khó có thể được trả lời từ các đoạn văn bản đã cho. Trong trường hợp đó, hệ thống có thể đưa ra câu trả lời chất lượng thấp hoặc không có căn cứ, cùng với answerableProbability thấp.

answerableProbability number

Chỉ có đầu ra. Ước tính của mô hình về xác suất câu trả lời của mô hình là chính xác và dựa trên các đoạn văn bản đầu vào.

answerableProbability thấp cho biết câu trả lời có thể không dựa trên các nguồn.

Khi answerableProbability thấp, bạn nên:

Hiển thị thông báo "Chúng tôi không thể trả lời câu hỏi đó" cho người dùng.
Quay lại một LLM dùng cho nhiều mục đích để trả lời câu hỏi từ kiến thức thế giới. Ngưỡng và bản chất của các phương án dự phòng đó sẽ phụ thuộc vào từng trường hợp sử dụng. 0.5 là ngưỡng bắt đầu phù hợp.

inputFeedback object (InputFeedback)

Chỉ có đầu ra. Ý kiến phản hồi liên quan đến dữ liệu đầu vào dùng để trả lời câu hỏi, thay vì câu trả lời do mô hình tạo ra cho câu hỏi.

Dữ liệu đầu vào có thể là một hoặc nhiều loại sau:

Câu hỏi được chỉ định bởi mục nhập gần đây nhất trong GenerateAnswerRequest.content
Nhật ký cuộc trò chuyện do các mục khác trong GenerateAnswerRequest.content chỉ định
Nguồn nối đất (GenerateAnswerRequest.semantic_retriever hoặc GenerateAnswerRequest.inline_passages)

Biểu diễn dưới dạng JSON
{ "answer": { object (`Candidate`) }, "answerableProbability": number, "inputFeedback": { object (`InputFeedback`) } }

GroundingPassages

Danh sách lặp lại các đoạn văn bản.

Trường

passages[] object (GroundingPassage)

Danh sách các đoạn văn.

Biểu diễn dưới dạng JSON
{ "passages": [ { object (`GroundingPassage`) } ] }

GroundingPassage

Đoạn văn bản được đưa vào cùng dòng với cấu hình nối đất.

Trường

id string

Giá trị nhận dạng cho đoạn văn để phân bổ đoạn văn này trong câu trả lời có căn cứ.

content object (Content)

Nội dung của đoạn văn.

Biểu diễn dưới dạng JSON
{ "id": string, "content": { object (`Content`) } }

SemanticRetrieverConfig

Cấu hình để truy xuất nội dung liên quan từ Corpus hoặc Document được tạo bằng API Trình truy xuất ngữ nghĩa.

Trường

source string

Bắt buộc. Tên của tài nguyên cần truy xuất. Ví dụ: corpora/123 hoặc corpora/123/documents/abc.

query object (Content)

Bắt buộc. Truy vấn dùng để so khớp Chunk trong tài nguyên đã cho theo mức độ tương đồng.

metadataFilters[] object (MetadataFilter)

Không bắt buộc. Bộ lọc để chọn Document và/hoặc Chunk từ tài nguyên.

maxChunksCount integer

Không bắt buộc. Số lượng Chunk có liên quan tối đa để truy xuất.

minimumRelevanceScore number

Không bắt buộc. Điểm mức độ liên quan tối thiểu cho các Chunk có liên quan được truy xuất.

Biểu diễn dưới dạng JSON
{ "source": string, "query": { object (`Content`) }, "metadataFilters": [ { object (`MetadataFilter`) } ], "maxChunksCount": integer, "minimumRelevanceScore": number }

AnswerStyle

Kiểu cho câu trả lời dựa trên thực tế.

Enum
`ANSWER_STYLE_UNSPECIFIED`	Kiểu câu trả lời không xác định.
`ABSTRACTIVE`	Kiểu ngắn gọn nhưng trừu tượng.
`EXTRACTIVE`	Kiểu rất ngắn gọn và trích xuất.
`VERBOSE`	Kiểu chi tiết bao gồm thêm thông tin chi tiết. Nội dung phản hồi có thể được định dạng dưới dạng một câu, một đoạn, nhiều đoạn hoặc các dấu đầu dòng, v.v.

InputFeedback

Ý kiến phản hồi liên quan đến dữ liệu đầu vào dùng để trả lời câu hỏi, thay vì câu trả lời do mô hình tạo ra cho câu hỏi đó.

Trường

safetyRatings[] object (SafetyRating)

Điểm xếp hạng về mức độ an toàn của dữ liệu đầu vào. Mỗi danh mục chỉ có tối đa một mức phân loại.

blockReason enum (BlockReason)

Không bắt buộc. Nếu được đặt, dữ liệu đầu vào sẽ bị chặn và không có đề xuất nào được trả về. Diễn đạt lại dữ liệu đầu vào.

Biểu diễn dưới dạng JSON
{ "safetyRatings": [ { object (`SafetyRating`) } ], "blockReason": enum (`BlockReason`) }

BlockReason

Chỉ định lý do khiến dữ liệu đầu vào bị chặn.

Enum
`BLOCK_REASON_UNSPECIFIED`	Giá trị mặc định. Giá trị này không được sử dụng.
`SAFETY`	Đầu vào đã bị chặn vì lý do an toàn. Kiểm tra `safetyRatings` để biết danh mục an toàn nào đã chặn ứng dụng.
`OTHER`	Dữ liệu đầu vào bị chặn vì lý do khác.