REST Resource: corpora.documents.chunks

Risorsa: blocco

Un Chunk è una sottoparte di un Document che viene trattato come un'unità indipendente ai fini della rappresentazione vettoriale e dell'archiviazione. Un Corpus può avere un massimo di 1 milione di Chunk.

Rappresentazione JSON
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}
Campi
name

string

Immutabile. Identificatore. Il nome della risorsa Chunk. L'ID (nome senza il prefisso "corpora/*/documents/*/chunks/") può contenere fino a 40 caratteri tra caratteri alfanumerici minuscoli o trattini (-). L'ID non può iniziare o terminare con un trattino. Se al momento della creazione il nome risulta vuoto, verrà generato un ID univoco casuale di 12 caratteri. Esempio: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data

object (ChunkData)

Obbligatorio. I contenuti dell'elemento Chunk, ad esempio la stringa di testo. Il numero massimo di token per blocco è 2043.

customMetadata[]

object (CustomMetadata)

Campo facoltativo. Metadati personalizzati forniti dall'utente archiviati come coppie chiave-valore. Il numero massimo di CustomMetadata per blocco è 20.

createTime

string (Timestamp format)

Solo output. Il timestamp relativo alla creazione di Chunk.

Un timestamp in formato "Zulu" UTC RFC3339, con risoluzione in nanosecondi e fino a nove cifre frazionarie. Esempi: "2014-10-02T15:01:23Z" e "2014-10-02T15:01:23.045123456Z".

updateTime

string (Timestamp format)

Solo output. Il timestamp dell'ultimo aggiornamento di Chunk.

Un timestamp in formato "Zulu" UTC RFC3339, con risoluzione in nanosecondi e fino a nove cifre frazionarie. Esempi: "2014-10-02T15:01:23Z" e "2014-10-02T15:01:23.045123456Z".

state

enum (State)

Solo output. Stato attuale di Chunk.

ChunkData

Dati estratti che rappresentano i contenuti di Chunk.

Rappresentazione JSON
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}
Campi

Campo di unione data.

data può essere solo uno dei seguenti:

stringValue

string

Il contenuto Chunk come stringa. Il numero massimo di token per blocco è 2043.

Stato

Stati per il ciclo di vita di un elemento Chunk.

Enum
STATE_UNSPECIFIED Il valore predefinito. Questo valore viene utilizzato se lo stato viene omesso.
STATE_PENDING_PROCESSING Chunk è in fase di elaborazione (incorporamento e archiviazione vettoriale).
STATE_ACTIVE Chunk è stato elaborato ed è disponibile per le query.
STATE_FAILED Elaborazione di Chunk non riuscita.

Metodi

batchCreate

Creazione in gruppo di Chunk.

batchDelete

Elimina in blocco Chunk sec.

batchUpdate

Aggiorna in gruppo Chunk s.

create

Crea un Chunk.

delete

Elimina un Chunk.

get

Riceve informazioni su un Chunk specifico.

list

Elenca tutti i Chunk in un Document.

patch

Aggiorna un Chunk.