Chunks

Methode: corpora.documents.chunks.create

Erstellt einen Chunk.

Endpunkt

Beitrag https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks

Pfadparameter

parent string

Erforderlich. Der Name des Document, in dem diese Chunk erstellt werden soll. Beispiel: corpora/my-corpus-123/documents/the-doc-abc hat das Format corpora/{corpora}/documents/{document}.

Anfragetext

Der Anfragetext enthält eine Instanz von Chunk.

Felder
name string

Nicht veränderbar. Kennung. Der Name der Chunk-Ressource. Die ID (Name ohne das Präfix „corpora/*/documents/*/chunks/“) kann bis zu 40 Zeichen (kleingeschriebene alphanumerische Zeichen oder Bindestriche (-) enthalten) enthalten. Die ID darf nicht mit einem Bindestrich beginnen oder enden. Wenn der Name beim Erstellen leer ist, wird eine zufällige 12-stellige eindeutige ID generiert. Beispiel: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data object (ChunkData)

Erforderlich. Der Inhalt für Chunk, z. B. der Textstring. Die maximale Anzahl von Tokens pro Block ist 2.043.

customMetadata[] object (CustomMetadata)

Optional. Vom Nutzer bereitgestellte benutzerdefinierte Metadaten, die als Schlüssel/Wert-Paare gespeichert werden. Die maximale Anzahl von CustomMetadata pro Block beträgt 20.

Antworttext

Bei Erfolg enthält der Antworttext eine neu erstellte Instanz von Chunk.

Methode: corpora.documents.chunks.list

Listet alle Chunks in einem Document auf.

Endpunkt

get https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks

Pfadparameter

parent string

Erforderlich. Der Name des Document, der Chunks enthält. Beispiel: corpora/my-corpus-123/documents/the-doc-abc. Sie hat das Format corpora/{corpora}/documents/{document}.

Abfrageparameter

pageSize integer

Optional. Die maximale Anzahl von Chunks, die zurückgegeben werden sollen (pro Seite). Der Dienst gibt möglicherweise weniger Chunks zurück.

Wenn nicht angegeben, werden höchstens 10 Chunks zurückgegeben. Die maximale Größe beträgt 100 Chunk pro Seite.

pageToken string

Optional. Ein Seitentoken, das von einem vorherigen chunks.list-Aufruf empfangen wurde.

Gib den in der Antwort zurückgegebenen Wert nextPageToken als Argument für die nächste Anfrage an, um die nächste Seite abzurufen.

Beim Paginieren müssen alle anderen für chunks.list bereitgestellten Parameter mit dem Aufruf übereinstimmen, der das Seitentoken bereitgestellt hat.

Anfragetext

Der Anfragetext muss leer sein.

Antworttext

Antwort von chunks.list mit einer paginierten Liste von Chunks. Die Chunks sind nach aufsteigendem chunk.create_time sortiert.

Bei Erfolg enthält der Antworttext Daten mit der folgenden Struktur:

Felder
chunks[] object (Chunk)

Die zurückgegebenen Chunks.

nextPageToken string

Ein Token, das als pageToken gesendet werden kann, um die nächste Seite abzurufen. Wenn dieses Feld weggelassen wird, sind keine Seiten mehr vorhanden.

JSON-Darstellung
{
  "chunks": [
    {
      object (Chunk)
    }
  ],
  "nextPageToken": string
}

Methode: corpora.documents.chunks.get

Ruft Informationen zu einer bestimmten Chunk ab.

Endpunkt

erhalten https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*/chunks/*}

Pfadparameter

name string

Erforderlich. Der Name des abzurufenden Chunk. Beispiel: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk hat das Format corpora/{corpora}/documents/{document}/chunks/{chunk}.

Anfragetext

Der Anfragetext muss leer sein.

Antworttext

Wenn der Vorgang erfolgreich abgeschlossen wurde, enthält der Antworttext eine Instanz von Chunk.

Methode: corpora.documents.chunks.patch

Aktualisiert einen Chunk.

Endpunkt

Patch https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}

PATCH https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}

Pfadparameter

chunk.name string

Nicht veränderbar. Kennung. Der Ressourcenname Chunk. Die ID (Name ohne das Präfix „corpora/*/documents/*/chunks/“) kann bis zu 40 Zeichen enthalten, die aus Kleinbuchstaben, alphanumerischen Zeichen oder Bindestrichen (-) bestehen. Die ID darf nicht mit einem Bindestrich beginnen oder enden. Wenn der Name beim Erstellen leer ist, wird eine zufällige 12-stellige eindeutige ID generiert. Beispiel: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c. Sie hat das Format corpora/{corpora}/documents/{document}/chunks/{chunk}.

Abfrageparameter

updateMask string (FieldMask format)

Erforderlich. Die Liste der zu aktualisierenden Felder. Derzeit wird nur die Aktualisierung von customMetadata und data unterstützt.

Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

Anfragetext

Der Anfragetext enthält eine Instanz von Chunk.

Felder
data object (ChunkData)

Erforderlich. Der Inhalt der Chunk, z. B. der Textstring. Die maximale Anzahl von Tokens pro Block ist 2.043.

customMetadata[] object (CustomMetadata)

Optional. Vom Nutzer bereitgestellte benutzerdefinierte Metadaten, die als Schlüssel/Wert-Paare gespeichert werden. Die maximale Anzahl von CustomMetadata pro Block beträgt 20.

Antworttext

Wenn der Vorgang erfolgreich abgeschlossen wurde, enthält der Antworttext eine Instanz von Chunk.

Methode: corpora.documents.chunks.delete

Löscht ein Chunk.

Endpunkt

delete https://generativelanguage.googleapis.com/v1beta/{name=corpora/*/documents/*/chunks/*}

Pfadparameter

name string

Erforderlich. Der Ressourcenname des zu löschenden Chunk. Beispiel: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk hat das Format corpora/{corpora}/documents/{document}/chunks/{chunk}.

Anfragetext

Der Anfragetext muss leer sein.

Antworttext

Wenn der Vorgang erfolgreich ist, ist der Antworttext leer.

Methode: corpora.documents.chunks.batchCreate

Erstellen Sie im Batch Chunks.

Endpunkt

Beitrag https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks:batchCreate

Pfadparameter

parent string

Optional. Der Name der Document, in der dieser Batch von Chunks erstellt wird. Das übergeordnete Feld in jedem CreateChunkRequest muss mit diesem Wert übereinstimmen. Beispiel: corpora/my-corpus-123/documents/the-doc-abc hat das Format corpora/{corpora}/documents/{document}.

Anfragetext

Der Anfragetext enthält Daten mit folgender Struktur:

Felder
requests[] object (CreateChunkRequest)

Erforderlich. Die Anfragenachrichten, in denen die zu erstellenden Chunk angegeben sind. Es können maximal 100 Chunks in einem Batch erstellt werden.

Antworttext

Antwort von chunks.batchCreate mit einer Liste der erstellten Chunks.

Bei Erfolg enthält der Antworttext Daten mit der folgenden Struktur:

Felder
chunks[] object (Chunk)

Chunks erstellt.

JSON-Darstellung
{
  "chunks": [
    {
      object (Chunk)
    }
  ]
}

CreateChunkRequest

Anfrage zum Erstellen eines Chunk.

Felder
parent string

Erforderlich. Der Name des Document, in dem diese Chunk erstellt werden soll. Beispiel: corpora/my-corpus-123/documents/the-doc-abc

chunk object (Chunk)

Erforderlich. Die zu erstellende Chunk.

JSON-Darstellung
{
  "parent": string,
  "chunk": {
    object (Chunk)
  }
}

Methode: corpora.documents.chunks.batchUpdate

Chunks per Batch aktualisieren

Endpunkt

Beitrag https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks:batchUpdate

Pfadparameter

parent string

Optional. Der Name der Document, die die zu aktualisierenden Chunk enthält. Das übergeordnete Feld in jedem UpdateChunkRequest muss mit diesem Wert übereinstimmen. Beispiel: corpora/my-corpus-123/documents/the-doc-abc. Sie hat das Format corpora/{corpora}/documents/{document}.

Anfragetext

Der Anfragetext enthält Daten mit folgender Struktur:

Felder
requests[] object (UpdateChunkRequest)

Erforderlich. Die Anfragenachrichten, in denen die zu aktualisierenden Chunks angegeben sind. In einem Batch können maximal 100 Chunks aktualisiert werden.

Antworttext

Antwort von chunks.batchUpdate mit einer Liste aktualisierter Chunks.

Bei Erfolg enthält der Antworttext Daten mit der folgenden Struktur:

Felder
chunks[] object (Chunk)

Chunks aktualisiert.

JSON-Darstellung
{
  "chunks": [
    {
      object (Chunk)
    }
  ]
}

UpdateChunkRequest

Anfrage zur Aktualisierung einer Chunk.

Felder
chunk object (Chunk)

Erforderlich. Die zu aktualisierende Chunk.

updateMask string (FieldMask format)

Erforderlich. Die Liste der zu aktualisierenden Felder. Derzeit wird nur die Aktualisierung von customMetadata und data unterstützt.

Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

JSON-Darstellung
{
  "chunk": {
    object (Chunk)
  },
  "updateMask": string
}

Methode: corpora.documents.chunks.batchDelete

Chunk s im Batch löschen.

Endpunkt

Beitrag https://generativelanguage.googleapis.com/v1beta/{parent=corpora/*/documents/*}/chunks:batchDelete

Pfadparameter

parent string

Optional. Der Name der Document mit den zu löschenden Chunks. Das übergeordnete Feld in jedem DeleteChunkRequest muss mit diesem Wert übereinstimmen. Beispiel: corpora/my-corpus-123/documents/the-doc-abc. Sie hat das Format corpora/{corpora}/documents/{document}.

Anfragetext

Der Anfragetext enthält Daten mit folgender Struktur:

Felder
requests[] object (DeleteChunkRequest)

Erforderlich. Die Anfragenachrichten, in denen die zu löschenden Chunk angegeben sind.

Antworttext

Wenn der Vorgang erfolgreich ist, ist der Antworttext leer.

DeleteChunkRequest

Anfrage zum Löschen eines Chunk.

Felder
name string

Erforderlich. Der Ressourcenname der zu löschenden Chunk. Beispiel: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk

JSON-Darstellung
{
  "name": string
}

REST-Ressource: corpora.documents.chunks

Ressource: Chunk

Eine Chunk ist ein Unterteil einer Document, die zum Zweck der Vektordarstellung und Speicherung als unabhängige Einheit behandelt wird. Ein Corpus kann maximal 1 Million Chunks haben.

Felder
name string

Nicht veränderbar. Kennung. Der Ressourcenname Chunk. Die ID (Name ohne das Präfix „corpora/*/documents/*/chunks/“) kann bis zu 40 Zeichen (kleingeschriebene alphanumerische Zeichen oder Bindestriche (-) enthalten) enthalten. Die ID darf nicht mit einem Bindestrich beginnen oder enden. Wenn der Name beim Erstellen leer ist, wird eine zufällige eindeutige ID mit 12 Ziffern generiert. Beispiel: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data object (ChunkData)

Erforderlich. Der Inhalt für Chunk, z. B. der Textstring. Die maximale Anzahl von Tokens pro Block ist 2.043.

customMetadata[] object (CustomMetadata)

Optional. Vom Nutzer bereitgestellte benutzerdefinierte Metadaten, die als Schlüssel/Wert-Paare gespeichert sind. Die maximale Anzahl von CustomMetadata pro Block beträgt 20.

createTime string (Timestamp format)

Nur Ausgabe. Der Zeitstempel für die Erstellung der Chunk.

Ein Zeitstempel im Format RFC3339 UTC "Zulu" mit einer Auflösung im Nanosekundenbereich und bis zu neun Nachkommastellen. Beispiele: "2014-10-02T15:01:23Z" und "2014-10-02T15:01:23.045123456Z".

updateTime string (Timestamp format)

Nur Ausgabe. Der Zeitstempel für die letzte Aktualisierung der Chunk.

Ein Zeitstempel im Format RFC3339 UTC "Zulu" mit einer Auflösung im Nanosekundenbereich und bis zu neun Nachkommastellen. Beispiele: "2014-10-02T15:01:23Z" und "2014-10-02T15:01:23.045123456Z".

state enum (State)

Nur Ausgabe. Aktueller Status von Chunk.

JSON-Darstellung
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}

ChunkData

Extrahierte Daten, die den Chunk-Inhalt darstellen.

Felder

Union-Feld data.

Für data ist nur einer der folgenden Werte zulässig:

stringValue string

Der Chunk-Inhalt als String. Die maximale Anzahl von Tokens pro Block ist 2.043.

JSON-Darstellung
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}

Status

Status für den Lebenszyklus einer Chunk.

Enums
STATE_UNSPECIFIED Der Standardwert. Dieser Wert wird verwendet, wenn der Status weggelassen wird.
STATE_PENDING_PROCESSING Chunk wird verarbeitet (Einbettung und Vektorspeicherung).
STATE_ACTIVE Chunk wird verarbeitet und ist zum Abfragen verfügbar.
STATE_FAILED Chunk-Verarbeitung fehlgeschlagen.