Chunks

Phương thức: corpora.documents.chunks.create

Tạo Chunk.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks

Tham số đường dẫn

parent string

Bắt buộc. Tên của DocumentChunk này sẽ được tạo. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Nó có dạng corpora/{corpora}/documents/{document}.

Nội dung yêu cầu

Nội dung yêu cầu chứa một bản sao của Chunk.

Trường
name string

Bất biến. Giá trị nhận dạng. Tên tài nguyên Chunk. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/*/chunks/") có thể chứa tối đa 40 ký tự chữ-số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên này trống khi tạo, một mã nhận dạng duy nhất ngẫu nhiên gồm 12 ký tự sẽ được tạo. Ví dụ: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data object (ChunkData)

Bắt buộc. Nội dung cho Chunk, chẳng hạn như chuỗi văn bản. Số lượng mã thông báo tối đa cho mỗi phân đoạn là 2043.

customMetadata[] object (CustomMetadata)

Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị. Số lượng tối đa CustomMetadata trên mỗi đoạn là 20.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ chứa một thực thể mới tạo của Chunk.

Phương thức: corpora.documents.chunks.list

Liệt kê tất cả Chunk trong Document.

Điểm cuối

get https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks

Tham số đường dẫn

parent string

Bắt buộc. Tên của Document chứa Chunk. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Nó có dạng corpora/{corpora}/documents/{document}.

Tham số truy vấn

pageSize integer

Không bắt buộc. Số Chunk giây tối đa cần trả về (trên mỗi trang). Dịch vụ có thể trả về ít Chunk hơn.

Nếu bạn không chỉ định, hàm sẽ trả về tối đa 10 Chunk giây. Giới hạn kích thước tối đa là 100 Chunk trên mỗi trang.

pageToken string

Không bắt buộc. Mã thông báo trang, nhận được từ lệnh gọi chunks.list trước đó.

Cung cấp nextPageToken được trả về trong phản hồi dưới dạng một đối số cho yêu cầu tiếp theo để truy xuất trang tiếp theo.

Khi phân trang, tất cả các tham số khác được cung cấp cho chunks.list phải khớp với lệnh gọi đã cung cấp mã thông báo trang.

Nội dung yêu cầu

Nội dung yêu cầu phải trống.

Nội dung phản hồi

Phản hồi của chunks.list chứa danh sách Chunk được phân trang. Các Chunk được sắp xếp theo thứ tự tăng dần chunk.create_time.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Số trường
chunks[] object (Chunk)

Các Chunk được trả về.

nextPageToken string

Mã thông báo có thể được gửi dưới dạng pageToken để truy xuất trang tiếp theo. Nếu bạn bỏ qua trường này, thì sẽ không có trang nào khác.

Biểu diễn dưới dạng JSON
{
  "chunks": [
    {
      object (Chunk)
    }
  ],
  "nextPageToken": string
}

Phương thức: corpora.documents.chunks.get

Lấy thông tin về một Chunk cụ thể.

Điểm cuối

nhận https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*/chunks/*}

Tham số đường dẫn

name string

Bắt buộc. Tên của Chunk cần truy xuất. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk Hàm này có dạng corpora/{corpora}/documents/{document}/chunks/{chunk}.

Nội dung yêu cầu

Nội dung yêu cầu phải trống.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ chứa một phiên bản của Chunk.

Phương thức: corpora.documents.chunks.patch

Cập nhật Chunk.

Điểm cuối

patch https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}

PATCH https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}

Tham số đường dẫn

chunk.name string

Bất biến. Giá trị nhận dạng. Tên tài nguyên Chunk. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/*/chunks/") có thể chứa tối đa 40 ký tự là chữ hoặc số hoặc dấu gạch ngang (-) viết thường. Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu bạn để trống tên khi tạo, hệ thống sẽ tạo một mã nhận dạng duy nhất gồm 12 ký tự ngẫu nhiên. Ví dụ: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c Hàm này có dạng corpora/{corpora}/documents/{document}/chunks/{chunk}.

Tham số truy vấn

updateMask string (FieldMask format)

Bắt buộc. Danh sách các trường cần cập nhật. Hiện tại, tính năng này chỉ hỗ trợ việc cập nhật customMetadatadata.

Đây là danh sách các tên trường đủ điều kiện được phân tách bằng dấu phẩy. Ví dụ: "user.displayName,photo"

Nội dung yêu cầu

Nội dung yêu cầu chứa một bản sao của Chunk.

Trường
data object (ChunkData)

Bắt buộc. Nội dung cho Chunk, chẳng hạn như chuỗi văn bản. Số lượng mã thông báo tối đa cho mỗi phần là 2043.

customMetadata[] object (CustomMetadata)

Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị. Số lượng tối đa CustomMetadata trên mỗi đoạn là 20.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ chứa một phiên bản của Chunk.

Phương thức: corpora.documents.chunks.delete

Xoá một Chunk.

Điểm cuối

xoá https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*/chunks/*}

Tham số đường dẫn

name string

Bắt buộc. Tên tài nguyên của Chunk cần xoá. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk Nó có dạng corpora/{corpora}/documents/{document}/chunks/{chunk}.

Nội dung yêu cầu

Nội dung yêu cầu phải trống.

Nội dung phản hồi

Nếu thành công, nội dung phản hồi sẽ trống.

Phương thức: corpora.documents.chunks.batchCreate

Tạo hàng loạt Chunk.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks:batchCreate

Tham số đường dẫn

parent string

Không bắt buộc. Tên của Document mà lô Chunk này sẽ được tạo. Trường mẹ trong mỗi CreateChunkRequest phải khớp với giá trị này. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Hàm này có dạng corpora/{corpora}/documents/{document}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Số trường
requests[] object (CreateChunkRequest)

Bắt buộc. Các thông báo yêu cầu chỉ định các Chunk cần tạo. Bạn có thể tạo tối đa 100 Chunk trong một lô.

Nội dung phản hồi

Phản hồi của chunks.batchCreate chứa danh sách các Chunk đã tạo.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Số trường
chunks[] object (Chunk)

Đã tạo các Chunk.

Biểu diễn dưới dạng JSON
{
  "chunks": [
    {
      object (Chunk)
    }
  ]
}

CreateChunkRequest

Yêu cầu tạo Chunk.

Trường
parent string

Bắt buộc. Tên của DocumentChunk này sẽ được tạo. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc

chunk object (Chunk)

Bắt buộc. Chunk để tạo.

Biểu diễn dưới dạng JSON
{
  "parent": string,
  "chunk": {
    object (Chunk)
  }
}

Phương thức: corpora.documents.chunks.batchUpdate

Cập nhật theo lô Chunk.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks:batchUpdate

Tham số đường dẫn

parent string

Không bắt buộc. Tên của Document chứa các Chunk cần cập nhật. Trường mẹ trong mỗi UpdateChunkRequest phải khớp với giá trị này. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Hàm này có dạng corpora/{corpora}/documents/{document}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Số trường
requests[] object (UpdateChunkRequest)

Bắt buộc. Các thông báo yêu cầu chỉ định các Chunk cần cập nhật. Bạn có thể cập nhật tối đa 100 Chunk hàng loạt.

Nội dung phản hồi

Phản hồi của chunks.batchUpdate chứa danh sách các Chunk đã cập nhật.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Trường
chunks[] object (Chunk)

Đã cập nhật Chunk.

Biểu diễn dưới dạng JSON
{
  "chunks": [
    {
      object (Chunk)
    }
  ]
}

UpdateChunkRequest

Yêu cầu cập nhật một Chunk.

Số trường
chunk object (Chunk)

Bắt buộc. Chunk cần cập nhật.

updateMask string (FieldMask format)

Bắt buộc. Danh sách các trường cần cập nhật. Hiện tại, tính năng này chỉ hỗ trợ việc cập nhật customMetadatadata.

Đây là danh sách các tên trường đủ điều kiện được phân tách bằng dấu phẩy. Ví dụ: "user.displayName,photo"

Biểu diễn dưới dạng JSON
{
  "chunk": {
    object (Chunk)
  },
  "updateMask": string
}

Phương thức: corpora.documents.chunks.batchDelete

Xoá hàng loạt Chunk.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks:batchDelete

Tham số đường dẫn

parent string

Không bắt buộc. Tên của Document chứa các Chunk cần xoá. Trường mẹ trong mỗi DeleteChunkRequest phải khớp với giá trị này. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc Nó có dạng corpora/{corpora}/documents/{document}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Số trường
requests[] object (DeleteChunkRequest)

Bắt buộc. Thông báo yêu cầu chỉ định Chunk cần xoá.

Nội dung phản hồi

Nếu thành công thì nội dung phản hồi sẽ trống.

DeleteChunkRequest

Yêu cầu xoá Chunk.

Số trường
name string

Bắt buộc. Tên tài nguyên của Chunk cần xoá. Ví dụ: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk

Biểu diễn dưới dạng JSON
{
  "name": string
}

Tài nguyên REST: corpora.documents.chunks

Tài nguyên: Mảnh

Chunk là một phần phụ của Document được coi là một đơn vị độc lập cho mục đích biểu thị và lưu trữ vectơ. Corpus có thể có tối đa 1 triệu Chunk.

Trường
name string

Không thể thay đổi. Giá trị nhận dạng. Tên tài nguyên Chunk. Mã nhận dạng (tên không bao gồm tiền tố "corpora/*/documents/*/chunks/") có thể chứa tối đa 40 ký tự chữ-số viết thường hoặc dấu gạch ngang (-). Mã nhận dạng không được bắt đầu hoặc kết thúc bằng dấu gạch ngang. Nếu tên này trống khi tạo, một mã nhận dạng duy nhất ngẫu nhiên gồm 12 ký tự sẽ được tạo. Ví dụ: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data object (ChunkData)

Bắt buộc. Nội dung cho Chunk, chẳng hạn như chuỗi văn bản. Số lượng mã thông báo tối đa cho mỗi phân đoạn là 2043.

customMetadata[] object (CustomMetadata)

Không bắt buộc. Siêu dữ liệu tuỳ chỉnh do người dùng cung cấp được lưu trữ dưới dạng cặp khoá-giá trị. Số lượng tối đa CustomMetadata trên mỗi đoạn là 20.

createTime string (Timestamp format)

Chỉ có đầu ra. Dấu thời gian của thời điểm tạo Chunk.

Dấu thời gian theo múi giờ "Zulu" RFC3339 (giờ UTC) với độ phân giải nano giây và lên đến 9 chữ số phân số. Ví dụ: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z".

updateTime string (Timestamp format)

Chỉ có đầu ra. Dấu thời gian về lần cập nhật Chunk gần đây nhất.

Dấu thời gian ở định dạng "Zulu" RFC3339 UTC, có độ phân giải nano giây và tối đa 9 chữ số thập phân. Ví dụ: "2014-10-02T15:01:23Z""2014-10-02T15:01:23.045123456Z".

state enum (State)

Chỉ có đầu ra. Trạng thái hiện tại của Chunk.

Biểu diễn dưới dạng JSON
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}

ChunkData

Dữ liệu được trích xuất đại diện cho nội dung Chunk.

Số trường

Trường kết hợp data.

data chỉ có thể là một trong những giá trị sau:

stringValue string

Nội dung Chunk dưới dạng chuỗi. Số lượng mã thông báo tối đa cho mỗi phân đoạn là 2043.

Biểu diễn dưới dạng JSON
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}

Tiểu bang

Các trạng thái cho vòng đời của Chunk.

Enum
STATE_UNSPECIFIED Giá trị mặc định. Giá trị này được dùng nếu trạng thái bị bỏ qua.
STATE_PENDING_PROCESSING Chunk đang được xử lý (nhúng và lưu trữ vectơ).
STATE_ACTIVE Chunk đã được xử lý và có thể truy vấn.
STATE_FAILED Không xử lý được Chunk.