REST Resource: corpora.documents.chunks

Resource: Chunk

Chunk adalah subbagian dari Document yang diperlakukan sebagai unit independen untuk tujuan representasi vektor dan penyimpanan. Corpus dapat memiliki maksimum 1 juta Chunk.

Representasi JSON
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}
Kolom
name

string

Tidak dapat diubah. ID. Nama resource Chunk. ID (nama tidak termasuk awalan "corpora/*/documents/*/chunks/") dapat berisi hingga 40 karakter alfanumerik huruf kecil atau tanda hubung (-). ID tidak dapat diawali atau diakhiri dengan tanda hubung. Jika nama kosong saat pembuatan, ID unik acak 12 karakter akan dibuat. Contoh: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data

object (ChunkData)

Wajib. Konten untuk Chunk, seperti string teks. Jumlah maksimum token per bagian adalah 2043.

customMetadata[]

object (CustomMetadata)

Opsional. Metadata kustom yang diberikan pengguna yang disimpan sebagai key-value pair. Jumlah maksimum CustomMetadata per bagian adalah 20.

createTime

string (Timestamp format)

Hanya output. Stempel waktu saat Chunk dibuat.

Stempel waktu dalam format RFC3339 UTC "Zulu", dengan resolusi nanodetik dan hingga sembilan digit pecahan. Contoh: "2014-10-02T15:01:23Z" dan "2014-10-02T15:01:23.045123456Z".

updateTime

string (Timestamp format)

Hanya output. Stempel waktu saat Chunk terakhir diperbarui.

Stempel waktu dalam format RFC3339 UTC "Zulu", dengan resolusi nanodetik dan hingga sembilan digit pecahan. Contoh: "2014-10-02T15:01:23Z" dan "2014-10-02T15:01:23.045123456Z".

state

enum (State)

Hanya output. Status Chunk saat ini.

ChunkData

Mengekstrak data yang mewakili konten Chunk.

Representasi JSON
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}
Kolom

Kolom union data.

data hanya dapat berupa salah satu dari berikut:

stringValue

string

Konten Chunk sebagai string. Jumlah maksimum token per bagian adalah 2043.

Negara Bagian

Status untuk siklus proses Chunk.

Enum
STATE_UNSPECIFIED Nilai default. Nilai ini digunakan jika status dihilangkan.
STATE_PENDING_PROCESSING Chunk sedang diproses (penyematan dan penyimpanan vektor).
STATE_ACTIVE Chunk diproses dan tersedia untuk pembuatan kueri.
STATE_FAILED Chunk gagal diproses.

Metode

batchCreate

Membuat Chunk secara massal.

batchDelete

Menghapus massal Chunk.

batchUpdate

Update massal Chunk.

create

Membuat Chunk.

delete

Menghapus Chunk.

get

Mendapatkan informasi tentang Chunk tertentu.

list

Mencantumkan semua Chunk dalam Document.

patch

Memperbarui Chunk.