Documents

Phương thức: corpora.documents.create

Tạo một Document trống.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*}/documents

Tham số đường dẫn

parent string

Bắt buộc. Tên của CorpusDocument này sẽ được tạo. Ví dụ: corpora/my-corpus-123 Nó có dạng corpora/{corpora}.

Nội dung yêu cầu

Nội dung yêu cầu chứa một bản sao của Document.

Trường
name string

Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Document. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/") có thể chứa tối đa 40 ký tự chữ-số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên trống khi tạo, thì tên duy nhất sẽ được lấy từ displayName cùng với một hậu tố ngẫu nhiên gồm 12 ký tự. Ví dụ: corpora/{corpus_id}/documents/my-awesome-doc-123a456b789c

displayName string

Không bắt buộc. Tên hiển thị mà con người đọc được cho Document. Tên hiển thị không được dài quá 512 ký tự, kể cả dấu cách. Ví dụ: "Tài liệu về Trình truy xuất ngữ nghĩa"

customMetadata[] object (CustomMetadata)

Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị dùng để truy vấn. Document có thể có tối đa 20 CustomMetadata.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ chứa một thực thể Document mới tạo.

Phương thức: corpora.documents.query

Thực hiện tìm kiếm ngữ nghĩa trên Document.

Điểm cuối

đăng https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*}:query

Tham số đường dẫn

name string

Bắt buộc. Tên của Document để truy vấn. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Hàm này có dạng corpora/{corpora}/documents/{document}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Số trường
query string

Bắt buộc. Chuỗi truy vấn để thực hiện tìm kiếm ngữ nghĩa.

resultsCount integer

Không bắt buộc. Số lượng Chunk tối đa cần trả về. Dịch vụ có thể trả về ít Chunk hơn.

Nếu không chỉ định, hệ thống sẽ trả về tối đa 10 Chunk. Số lượng kết quả tối đa được chỉ định là 100.

metadataFilters[] object (MetadataFilter)

Không bắt buộc. Lọc siêu dữ liệu Chunk. Mỗi đối tượng MetadataFilter phải tương ứng với một khoá duy nhất. Nhiều đối tượng MetadataFilter được nối bằng hàm logic "AND".

Lưu ý: Hệ thống không hỗ trợ tính năng lọc cấp Document cho yêu cầu này vì tên Document đã được chỉ định.

Cụm từ tìm kiếm ví dụ: (năm >= 2020 OR năm < 2010) AND (thể loại = phim hay thể loại = hành động)

MetadataFilter object list: metadataFilters = [ {key = &quot;chunk.custom_metadata.year&quot; điều kiện = [{int_value = 2020, hoạt động = GREATER_EQUAL}, {int_value = 2010, hoạt động = LESS}}, {key = "chunk.custom_metadata.movies" conditions = [{stringValue = &quot;drama&quot;, operation = EQUAL}, {stringValue = &quot;action&quot;, operation = EQUAL}}]

Ví dụ về truy vấn cho một dải giá trị dạng số: (year > 2015 AND year <= 2020)

Danh sách đối tượng MetadataFilter: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2015, operation = GREATER}]}, {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = LESS_EQUAL}]}]

Lưu ý: Chỉ hỗ trợ toán tử "AND" cho cùng một khoá đối với các giá trị số. Giá trị chuỗi chỉ hỗ trợ "OR" cho cùng một khoá.

Nội dung phản hồi

Phản hồi từ documents.query chứa danh sách các đoạn liên quan.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Số trường
relevantChunks[] object (RelevantChunk)

Các đoạn có liên quan được trả về.

Biểu diễn dưới dạng JSON
{
  "relevantChunks": [
    {
      object (RelevantChunk)
    }
  ]
}

Phương thức: corpora.documents.list

Liệt kê tất cả Document trong một Corpus.

Điểm cuối

nhận https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*}/documents

Tham số đường dẫn

parent string

Bắt buộc. Tên của Corpus chứa Document. Ví dụ: corpora/my-corpus-123 Nó có dạng corpora/{corpora}.

Tham số truy vấn

pageSize integer

Không bắt buộc. Số Document giây tối đa cần trả về (trên mỗi trang). Dịch vụ có thể trả về ít Document hơn.

Nếu bạn không chỉ định, hàm sẽ trả về tối đa 10 Document giây. Giới hạn kích thước tối đa là 20 Document trên mỗi trang.

pageToken string

Không bắt buộc. Mã thông báo trang, nhận được từ lệnh gọi documents.list trước đó.

Cung cấp nextPageToken được trả về trong phản hồi dưới dạng đối số cho yêu cầu tiếp theo để truy xuất trang tiếp theo.

Khi phân trang, tất cả các tham số khác được cung cấp cho documents.list phải khớp với lệnh gọi đã cung cấp mã thông báo trang.

Nội dung yêu cầu

Nội dung yêu cầu phải trống.

Nội dung phản hồi

Phản hồi của documents.list chứa danh sách Document được phân trang. Document được sắp xếp theo document.create_time tăng dần.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Số trường
documents[] object (Document)

Các Document được trả về.

nextPageToken string

Mã thông báo có thể được gửi dưới dạng pageToken để truy xuất trang tiếp theo. Nếu bạn bỏ qua trường này, thì sẽ không có trang nào khác.

Biểu diễn dưới dạng JSON
{
  "documents": [
    {
      object (Document)
    }
  ],
  "nextPageToken": string
}

Phương thức: corpora.documents.get

Nhận thông tin về một Document cụ thể.

Điểm cuối

nhận https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*}

Tham số đường dẫn

name string

Bắt buộc. Tên của Document cần truy xuất. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Hàm này có dạng corpora/{corpora}/documents/{document}.

Nội dung yêu cầu

Nội dung yêu cầu phải trống.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ chứa một phiên bản của Document.

Phương thức: corpora.documents.patch

Cập nhật Document.

Điểm cuối

bản vá https://generativelanguage.googleapis.com/v1beta/{document.name=corpora/*/documents/*}

PATCH https://generativelanguage.googleapis.com/v1beta/{document.name=corpora/*/documents/*}

Tham số đường dẫn

document.name string

Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Document. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/") có thể chứa tối đa 40 ký tự chữ-số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên trống khi tạo, thì tên duy nhất sẽ được lấy từ displayName cùng với một hậu tố ngẫu nhiên gồm 12 ký tự. Ví dụ: corpora/{corpus_id}/documents/my-awesome-doc-123a456b789c Hàm này có dạng corpora/{corpora}/documents/{document}.

Tham số truy vấn

updateMask string (FieldMask format)

Bắt buộc. Danh sách các trường cần cập nhật. Hiện tại, tính năng này chỉ hỗ trợ cập nhật displayNamecustomMetadata.

Đây là danh sách tên trường đủ điều kiện được phân tách bằng dấu phẩy. Ví dụ: "user.displayName,photo"

Nội dung yêu cầu

Nội dung yêu cầu chứa một bản sao của Document.

Trường
displayName string

Không bắt buộc. Tên hiển thị mà con người có thể đọc được của Document. Tên hiển thị không được dài quá 512 ký tự, kể cả dấu cách. Ví dụ: "Tài liệu về Trình truy xuất ngữ nghĩa"

customMetadata[] object (CustomMetadata)

Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị dùng để truy vấn. Document có thể có tối đa 20 CustomMetadata.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ chứa một phiên bản của Document.

Phương thức: corpora.documents.delete

Xoá một Document.

Điểm cuối

xoá https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*}

Tham số đường dẫn

name string

Bắt buộc. Tên tài nguyên của Document cần xoá. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Nó có dạng corpora/{corpora}/documents/{document}.

Tham số truy vấn

force boolean

Không bắt buộc. Nếu bạn đặt giá trị này thành đúng (true), mọi Chunk và đối tượng liên quan đến Document này cũng sẽ bị xoá.

Nếu là false (mặc định), lỗi FAILED_PRECONDITION sẽ được trả về nếu Document chứa bất kỳ Chunk nào.

Nội dung yêu cầu

Nội dung yêu cầu phải trống.

Nội dung phản hồi

Nếu thành công thì nội dung phản hồi sẽ trống.

Tài nguyên REST: corpora.documents

Tài nguyên: Tài liệu

Document là một tập hợp các Chunk. Corpus có thể có tối đa 10.000 Document.

Số trường
name string

Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Document. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/") có thể chứa tối đa 40 ký tự là chữ và số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên trống khi tạo, thì tên duy nhất sẽ được lấy từ displayName cùng với một hậu tố ngẫu nhiên gồm 12 ký tự. Ví dụ: corpora/{corpus_id}/documents/my-awesome-doc-123a456b789c

displayName string

Không bắt buộc. Tên hiển thị mà con người đọc được cho Document. Tên hiển thị không được dài quá 512 ký tự, kể cả dấu cách. Ví dụ: "Tài liệu về Trình truy xuất ngữ nghĩa"

customMetadata[] object (CustomMetadata)

Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị dùng để truy vấn. Document có thể có tối đa 20 CustomMetadata.

updateTime string (Timestamp format)

Chỉ có đầu ra. Dấu thời gian về lần cập nhật Document gần đây nhất.

Dấu thời gian theo múi giờ "Zulu" RFC3339 (giờ UTC) với độ phân giải nano giây và lên đến 9 chữ số phân số. Ví dụ: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z".

createTime string (Timestamp format)

Chỉ có đầu ra. Dấu thời gian về thời điểm Document được tạo.

Dấu thời gian theo múi giờ "Zulu" RFC3339 (giờ UTC) với độ phân giải nano giây và lên đến 9 chữ số phân số. Ví dụ: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z".

Biểu diễn dưới dạng JSON
{
  "name": string,
  "displayName": string,
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "updateTime": string,
  "createTime": string
}

CustomMetadata

Siêu dữ liệu do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị.

Số trường
key string

Bắt buộc. Khoá của siêu dữ liệu cần lưu trữ.

Trường kết hợp value.

value chỉ có thể là một trong những trạng thái sau đây:

stringValue string

Giá trị chuỗi của siêu dữ liệu cần lưu trữ.

stringListValue object (StringList)

Giá trị StringList của siêu dữ liệu cần lưu trữ.

numericValue number

Giá trị số của siêu dữ liệu cần lưu trữ.

Biểu diễn dưới dạng JSON
{
  "key": string,

  // Union field value can be only one of the following:
  "stringValue": string,
  "stringListValue": {
    object (StringList)
  },
  "numericValue": number
  // End of list of possible types for union field value.
}

StringList

Các giá trị chuỗi do người dùng cung cấp được gán cho một khoá siêu dữ liệu duy nhất.

Số trường
values[] string

Giá trị chuỗi của siêu dữ liệu cần lưu trữ.

Biểu diễn dưới dạng JSON
{
  "values": [
    string
  ]
}