Phương thức: corpora.documents.create
Tạo một Document
trống.
Điểm cuối
bài đăng https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*}/documentsTham số đường dẫn
parent
string
Bắt buộc. Tên của Corpus
mà Document
này sẽ được tạo. Ví dụ: corpora/my-corpus-123
Nó có dạng corpora/{corpora}
.
Nội dung yêu cầu
Nội dung yêu cầu chứa một bản sao của Document
.
name
string
Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Document
. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/") có thể chứa tối đa 40 ký tự chữ-số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên trống khi tạo, thì tên duy nhất sẽ được lấy từ displayName
cùng với một hậu tố ngẫu nhiên gồm 12 ký tự. Ví dụ: corpora/{corpus_id}/documents/my-awesome-doc-123a456b789c
displayName
string
Không bắt buộc. Tên hiển thị mà con người đọc được cho Document
. Tên hiển thị không được dài quá 512 ký tự, kể cả dấu cách. Ví dụ: "Tài liệu về Trình truy xuất ngữ nghĩa"
customMetadata[]
object (CustomMetadata
)
Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị dùng để truy vấn. Document
có thể có tối đa 20 CustomMetadata
.
Nội dung phản hồi
Nếu thành công, nội dung phản hồi sẽ chứa một thực thể Document
mới tạo.
Phương thức: corpora.documents.query
Thực hiện tìm kiếm ngữ nghĩa trên Document
.
Điểm cuối
đăng https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*}:queryTham số đường dẫn
name
string
Bắt buộc. Tên của Document
để truy vấn. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc
Hàm này có dạng corpora/{corpora}/documents/{document}
.
Nội dung yêu cầu
Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:
query
string
Bắt buộc. Chuỗi truy vấn để thực hiện tìm kiếm ngữ nghĩa.
resultsCount
integer
Không bắt buộc. Số lượng Chunk
tối đa cần trả về. Dịch vụ có thể trả về ít Chunk
hơn.
Nếu không chỉ định, hệ thống sẽ trả về tối đa 10 Chunk
. Số lượng kết quả tối đa được chỉ định là 100.
metadataFilters[]
object (MetadataFilter
)
Không bắt buộc. Lọc siêu dữ liệu Chunk
. Mỗi đối tượng MetadataFilter
phải tương ứng với một khoá duy nhất. Nhiều đối tượng MetadataFilter
được nối bằng hàm logic "AND".
Lưu ý: Hệ thống không hỗ trợ tính năng lọc cấp Document
cho yêu cầu này vì tên Document
đã được chỉ định.
Cụm từ tìm kiếm ví dụ: (năm >= 2020 OR năm < 2010) AND (thể loại = phim hay thể loại = hành động)
MetadataFilter
object list: metadataFilters = [ {key = "chunk.custom_metadata.year" điều kiện = [{int_value = 2020, hoạt động = GREATER_EQUAL}, {int_value = 2010, hoạt động = LESS}}, {key = "chunk.custom_metadata.movies" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}}]
Ví dụ về truy vấn cho một dải giá trị dạng số: (year > 2015 AND year <= 2020)
Danh sách đối tượng MetadataFilter
: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2015, operation = GREATER}]}, {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = LESS_EQUAL}]}]
Lưu ý: Chỉ hỗ trợ toán tử "AND" cho cùng một khoá đối với các giá trị số. Giá trị chuỗi chỉ hỗ trợ "OR" cho cùng một khoá.
Nội dung phản hồi
Phản hồi từ documents.query
chứa danh sách các đoạn liên quan.
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
relevantChunks[]
object (RelevantChunk
)
Các đoạn có liên quan được trả về.
Biểu diễn dưới dạng JSON |
---|
{
"relevantChunks": [
{
object ( |
Phương thức: corpora.documents.list
Liệt kê tất cả Document
trong một Corpus
.
Điểm cuối
nhận https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*}/documentsTham số đường dẫn
parent
string
Bắt buộc. Tên của Corpus
chứa Document
. Ví dụ: corpora/my-corpus-123
Nó có dạng corpora/{corpora}
.
Tham số truy vấn
pageSize
integer
Không bắt buộc. Số Document
giây tối đa cần trả về (trên mỗi trang). Dịch vụ có thể trả về ít Document
hơn.
Nếu bạn không chỉ định, hàm sẽ trả về tối đa 10 Document
giây. Giới hạn kích thước tối đa là 20 Document
trên mỗi trang.
pageToken
string
Không bắt buộc. Mã thông báo trang, nhận được từ lệnh gọi documents.list
trước đó.
Cung cấp nextPageToken
được trả về trong phản hồi dưới dạng đối số cho yêu cầu tiếp theo để truy xuất trang tiếp theo.
Khi phân trang, tất cả các tham số khác được cung cấp cho documents.list
phải khớp với lệnh gọi đã cung cấp mã thông báo trang.
Nội dung yêu cầu
Nội dung yêu cầu phải trống.
Nội dung phản hồi
Phản hồi của documents.list
chứa danh sách Document
được phân trang. Document
được sắp xếp theo document.create_time
tăng dần.
Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:
documents[]
object (Document
)
Các Document
được trả về.
nextPageToken
string
Mã thông báo có thể được gửi dưới dạng pageToken
để truy xuất trang tiếp theo. Nếu bạn bỏ qua trường này, thì sẽ không có trang nào khác.
Biểu diễn dưới dạng JSON |
---|
{
"documents": [
{
object ( |
Phương thức: corpora.documents.get
Nhận thông tin về một Document
cụ thể.
Điểm cuối
nhận https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*}Tham số đường dẫn
name
string
Bắt buộc. Tên của Document
cần truy xuất. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc
Hàm này có dạng corpora/{corpora}/documents/{document}
.
Nội dung yêu cầu
Nội dung yêu cầu phải trống.
Nội dung phản hồi
Nếu thành công, nội dung phản hồi sẽ chứa một phiên bản của Document
.
Phương thức: corpora.documents.patch
Cập nhật Document
.
Điểm cuối
bản vá https://generativelanguage.googleapis.com/v1beta/{document.name=corpora/*/documents/*}PATCH https://generativelanguage.googleapis.com/v1beta/{document.name=corpora/*/documents/*}
Tham số đường dẫn
document.name
string
Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Document
. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/") có thể chứa tối đa 40 ký tự chữ-số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên trống khi tạo, thì tên duy nhất sẽ được lấy từ displayName
cùng với một hậu tố ngẫu nhiên gồm 12 ký tự. Ví dụ: corpora/{corpus_id}/documents/my-awesome-doc-123a456b789c
Hàm này có dạng corpora/{corpora}/documents/{document}
.
Tham số truy vấn
updateMask
string (FieldMask
format)
Bắt buộc. Danh sách các trường cần cập nhật. Hiện tại, tính năng này chỉ hỗ trợ cập nhật displayName
và customMetadata
.
Đây là danh sách tên trường đủ điều kiện được phân tách bằng dấu phẩy. Ví dụ: "user.displayName,photo"
Nội dung yêu cầu
Nội dung yêu cầu chứa một bản sao của Document
.
displayName
string
Không bắt buộc. Tên hiển thị mà con người có thể đọc được của Document
. Tên hiển thị không được dài quá 512 ký tự, kể cả dấu cách. Ví dụ: "Tài liệu về Trình truy xuất ngữ nghĩa"
customMetadata[]
object (CustomMetadata
)
Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị dùng để truy vấn. Document
có thể có tối đa 20 CustomMetadata
.
Nội dung phản hồi
Nếu thành công, nội dung phản hồi sẽ chứa một phiên bản của Document
.
Phương thức: corpora.documents.delete
Xoá một Document
.
Điểm cuối
xoá https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*}Tham số đường dẫn
name
string
Bắt buộc. Tên tài nguyên của Document
cần xoá. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc
Nó có dạng corpora/{corpora}/documents/{document}
.
Tham số truy vấn
force
boolean
Không bắt buộc. Nếu bạn đặt giá trị này thành đúng (true), mọi Chunk
và đối tượng liên quan đến Document
này cũng sẽ bị xoá.
Nếu là false (mặc định), lỗi FAILED_PRECONDITION
sẽ được trả về nếu Document
chứa bất kỳ Chunk
nào.
Nội dung yêu cầu
Nội dung yêu cầu phải trống.
Nội dung phản hồi
Nếu thành công thì nội dung phản hồi sẽ trống.
Tài nguyên REST: corpora.documents
Tài nguyên: Tài liệu
Document
là một tập hợp các Chunk
. Corpus
có thể có tối đa 10.000 Document
.
name
string
Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Document
. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/") có thể chứa tối đa 40 ký tự là chữ và số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên trống khi tạo, thì tên duy nhất sẽ được lấy từ displayName
cùng với một hậu tố ngẫu nhiên gồm 12 ký tự. Ví dụ: corpora/{corpus_id}/documents/my-awesome-doc-123a456b789c
displayName
string
Không bắt buộc. Tên hiển thị mà con người đọc được cho Document
. Tên hiển thị không được dài quá 512 ký tự, kể cả dấu cách. Ví dụ: "Tài liệu về Trình truy xuất ngữ nghĩa"
customMetadata[]
object (CustomMetadata
)
Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị dùng để truy vấn. Document
có thể có tối đa 20 CustomMetadata
.
updateTime
string (Timestamp
format)
Chỉ có đầu ra. Dấu thời gian về lần cập nhật Document
gần đây nhất.
Dấu thời gian theo múi giờ "Zulu" RFC3339 (giờ UTC) với độ phân giải nano giây và lên đến 9 chữ số phân số. Ví dụ: "2014-10-02T15:01:23Z"
và "2014-10-02T15:01:23.045123456Z"
.
createTime
string (Timestamp
format)
Chỉ có đầu ra. Dấu thời gian về thời điểm Document
được tạo.
Dấu thời gian theo múi giờ "Zulu" RFC3339 (giờ UTC) với độ phân giải nano giây và lên đến 9 chữ số phân số. Ví dụ: "2014-10-02T15:01:23Z"
và "2014-10-02T15:01:23.045123456Z"
.
Biểu diễn dưới dạng JSON |
---|
{
"name": string,
"displayName": string,
"customMetadata": [
{
object ( |
CustomMetadata
Siêu dữ liệu do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị.
key
string
Bắt buộc. Khoá của siêu dữ liệu cần lưu trữ.
Trường kết hợp value
.
value
chỉ có thể là một trong những trạng thái sau đây:
stringValue
string
Giá trị chuỗi của siêu dữ liệu cần lưu trữ.
stringListValue
object (StringList
)
Giá trị StringList của siêu dữ liệu cần lưu trữ.
numericValue
number
Giá trị số của siêu dữ liệu cần lưu trữ.
Biểu diễn dưới dạng JSON |
---|
{ "key": string, // Union field |
StringList
Các giá trị chuỗi do người dùng cung cấp được gán cho một khoá siêu dữ liệu duy nhất.
values[]
string
Giá trị chuỗi của siêu dữ liệu cần lưu trữ.
Biểu diễn dưới dạng JSON |
---|
{ "values": [ string ] } |