REST Resource: corpora.documents.chunks

Ressource: Segment

Un élément Chunk est une sous-partie d'un élément Document traitée comme une unité indépendante à des fins de représentation vectorielle et de stockage. Un Corpus ne peut pas comporter plus d'un million de Chunk.

Représentation JSON
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}
Champs
name

string

Immuable. Identifiant. Nom de ressource Chunk. L'ID (nom sans le préfixe "corpora/*/documents/*/chunks/") peut contenir jusqu'à 40 caractères alphanumériques minuscules ou tirets (-). Il ne peut pas commencer ni se terminer par un tiret. Si le nom est vide lors de la création, un identifiant unique aléatoire de 12 caractères sera généré. Exemple : corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data

object (ChunkData)

Obligatoire. Contenu de Chunk, tel que la chaîne de texte. Le nombre maximal de jetons par fragment est de 2 043.

customMetadata[]

object (CustomMetadata)

Facultatif. Métadonnées personnalisées fournies par l'utilisateur, stockées sous forme de paires clé/valeur. Le nombre maximal de CustomMetadata par fragment est de 20.

createTime

string (Timestamp format)

Uniquement en sortie. Horodatage de la création de Chunk.

Code temporel au format RFC3339 UTC "Zulu", avec une résolution à la nanoseconde et jusqu'à neuf chiffres fractionnaires. Exemples: "2014-10-02T15:01:23Z" et "2014-10-02T15:01:23.045123456Z".

updateTime

string (Timestamp format)

Uniquement en sortie. Horodatage de la dernière mise à jour de Chunk.

Code temporel au format RFC3339 UTC "Zulu", avec une résolution à la nanoseconde et jusqu'à neuf chiffres fractionnaires. Exemples: "2014-10-02T15:01:23Z" et "2014-10-02T15:01:23.045123456Z".

state

enum (State)

Uniquement en sortie. État actuel de Chunk.

ChunkData

Données extraites qui représentent le contenu Chunk.

Représentation JSON
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}
Champs

Champ d'union data.

data ne peut être qu'un des éléments suivants :

stringValue

string

Contenu Chunk sous forme de chaîne. Le nombre maximal de jetons par fragment est de 2 043.

État

États du cycle de vie d'une Chunk

Enums
STATE_UNSPECIFIED Valeur par défaut. Cette valeur est utilisée si l'état est omis.
STATE_PENDING_PROCESSING Chunk est en cours de traitement (représentation vectorielle continue et stockage vectoriel).
STATE_ACTIVE Chunk est traité et peut être interrogé.
STATE_FAILED Échec du traitement de Chunk.

Méthodes

batchCreate

Créer des Chunk de manière groupée

batchDelete

Suppression groupée de Chunk.

batchUpdate

Mise à jour groupée de Chunk.

create

Crée un objet Chunk.

delete

Supprime un Chunk.

get

Récupère des informations sur un Chunk spécifique.

list

Liste tous les Chunk d'une Document.

patch

Met à jour une Chunk.