REST Resource: corpora.documents.chunks

Kaynak: Yığın

Chunk, vektör gösterimi ve depolaması amacıyla bağımsız bir birim olarak kabul edilen Document öğesinin alt parçasıdır. Bir Corpus en fazla 1 milyon Chunk içerebilir.

JSON gösterimi
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}
Alanlar
name

string

Sabit. Tanımlayıcı. Chunk kaynağının adı. Kimlik ("corpora/*/documents/*/chunks/" öneki hariç), küçük harfli alfanümerik karakterler veya kısa çizgiler (-) içeren en fazla 40 karakter içerebilir. Kimlik, kısa çizgiyle başlayamaz veya bitemez. Oluşturma sırasında ad boş bırakılırsa 12 karakterli rastgele bir benzersiz kimlik oluşturulur. Örnek: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data

object (ChunkData)

Zorunlu. Chunk öğesinin içeriği, örneğin metin dizesidir. Parça başına maksimum jeton sayısı 2.043'tür.

customMetadata[]

object (CustomMetadata)

İsteğe bağlı. Kullanıcı tarafından sağlanan ve anahtar/değer çiftleri olarak depolanan özel meta veriler. Parça başına maksimum CustomMetadata sayısı 20'dir.

createTime

string (Timestamp format)

Yalnızca çıkış. Chunk öğesinin oluşturulduğu zamanı gösteren zaman damgası.

Nanosaniye çözünürlüğe ve en fazla dokuz kesir basamağına sahip, RFC3339 UTC "Zulu" biçiminde bir zaman damgası. Örnekler: "2014-10-02T15:01:23Z" ve "2014-10-02T15:01:23.045123456Z".

updateTime

string (Timestamp format)

Yalnızca çıkış. Chunk öğesinin en son güncellendiği zamanı gösteren zaman damgası.

Nanosaniye çözünürlüğe ve en fazla dokuz kesir basamağına sahip, RFC3339 UTC "Zulu" biçiminde bir zaman damgası. Örnekler: "2014-10-02T15:01:23Z" ve "2014-10-02T15:01:23.045123456Z".

state

enum (State)

Yalnızca çıkış. Chunk için mevcut durum.

ChunkData

Chunk içeriğini temsil eden, ayıklanmış veriler.

JSON gösterimi
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}
Alanlar

data alanı.

data şunlardan yalnızca biri olabilir:

stringValue

string

Dize olarak Chunk içeriği. Parça başına maksimum jeton sayısı 2.043'tür.

Eyalet

Chunk yaşam döngüsüne dair durumlar.

Sıralamalar
STATE_UNSPECIFIED Varsayılan değer. Eyalet atlanırsa bu değer kullanılır.
STATE_PENDING_PROCESSING Chunk işleniyor (yerleştirme ve vektör depolama).
STATE_ACTIVE Chunk işlendi ve sorgulanabilir.
STATE_FAILED Chunk işlenemedi.

Yöntemler

batchCreate

Toplu olarak Chunk oluştur.

batchDelete

Chunk sn. toplu sil.

batchUpdate

Chunk sn. toplu güncelle.

create

Chunk oluşturur.

delete

Bir Chunk dosyasını siler.

get

Belirli bir Chunk ile ilgili bilgileri alır.

list

Bir Document içindeki tüm Chunk öğelerini listeler.

patch

Chunk öğesini günceller.