Método: corpora.documents.chunks.create
Cria uma Chunk
.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks
Parâmetros de caminho
parent
string
Obrigatório. O nome do Document
em que o Chunk
será criado. Exemplo: corpora/my-corpus-123/documents/the-doc-abc
. Ele assume a forma corpora/{corpora}/documents/{document}
.
Corpo da solicitação
O corpo da solicitação contém uma instância de Chunk
.
name
string
Imutável. Identificador. O nome do recurso Chunk
. O ID (nome sem o prefixo "corpora/*/documents/*/chunks/") pode conter até 40 caracteres alfanuméricos minúsculos ou traços (-). O ID não pode começar nem terminar com um traço. Se o nome estiver vazio na criação, um ID exclusivo aleatório de 12 caracteres será gerado. Exemplo: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
data
object (ChunkData
)
Obrigatório. O conteúdo do Chunk
, como a string de texto. O número máximo de tokens por bloco é 2.043.
customMetadata[]
object (CustomMetadata
)
Opcional. Metadados personalizados fornecidos pelo usuário armazenados como pares de chave-valor. O número máximo de CustomMetadata
por bloco é 20.
Corpo da resposta
Se a solicitação for bem-sucedida, o corpo da resposta incluirá uma instância de Chunk
.
Método: corpora.documents.chunks.list
- Endpoint
- Parâmetros de caminho
- Parâmetros de consulta
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
Lista todos os Chunk
s em um Document
.
Endpoint
gethttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks
Parâmetros de caminho
parent
string
Obrigatório. O nome do Document
que contém Chunk
s. Exemplo: corpora/my-corpus-123/documents/the-doc-abc
. Ele assume a forma corpora/{corpora}/documents/{document}
.
Parâmetros de consulta
pageSize
integer
Opcional. O número máximo de Chunk
s a serem retornados (por página). O serviço pode retornar menos Chunk
s.
Se não for especificado, no máximo 10 Chunk
s serão retornados. O limite máximo é de 100 Chunk
s por página.
pageToken
string
Opcional. Um token de página recebido de uma chamada chunks.list
anterior.
Forneça o nextPageToken
retornado na resposta como um argumento para a próxima solicitação e recupere a página seguinte.
Ao paginar, todos os outros parâmetros fornecidos para chunks.list
precisam corresponder à chamada que forneceu o token da página.
Corpo da solicitação
O corpo da solicitação precisa estar vazio.
Corpo da resposta
Resposta de chunks.list
contendo uma lista paginada de Chunk
s. Os Chunk
s são classificados por chunk.create_time
crescente.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
chunks[]
object (Chunk
)
Os Chunk
s retornados.
nextPageToken
string
Um token, que pode ser enviado como pageToken
para recuperar a próxima página. Se esse campo for omitido, não haverá mais páginas.
Representação JSON |
---|
{
"chunks": [
{
object ( |
Método: corpora.documents.chunks.get
Recebe informações sobre um Chunk
específico.
Endpoint
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /* /documents /* /chunks /*}
Parâmetros de caminho
name
string
Obrigatório. O nome do Chunk
a ser recuperado. Exemplo: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
. Ele assume a forma corpora/{corpora}/documents/{document}/chunks/{chunk}
.
Corpo da solicitação
O corpo da solicitação precisa estar vazio.
Corpo da resposta
Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Chunk
.
Método: corpora.documents.chunks.patch
- Endpoint
- Parâmetros de caminho
- Parâmetros de consulta
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
Atualiza um Chunk
.
Endpoint
patchhttps: / /generativelanguage.googleapis.com /v1beta /{chunk.name=corpora /* /documents /* /chunks /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}
Parâmetros de caminho
chunk.name
string
Imutável. Identificador. O nome do recurso Chunk
. O ID (nome sem o prefixo "corpora/*/documents/*/chunks/") pode conter até 40 caracteres alfanuméricos minúsculos ou traços (-). O ID não pode começar nem terminar com um traço. Se o nome estiver vazio na criação, um ID exclusivo aleatório de 12 caracteres será gerado. Exemplo: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
. Ele assume a forma corpora/{corpora}/documents/{document}/chunks/{chunk}
.
Parâmetros de consulta
updateMask
string (FieldMask
format)
Obrigatório. Lista de campos a serem atualizados. No momento, isso só permite atualizar customMetadata
e data
.
É uma lista separada por vírgulas de nomes de campos totalmente qualificados. Exemplo: "user.displayName,photo"
.
Corpo da solicitação
O corpo da solicitação contém uma instância de Chunk
.
data
object (ChunkData
)
Obrigatório. O conteúdo do Chunk
, como a string de texto. O número máximo de tokens por bloco é 2.043.
customMetadata[]
object (CustomMetadata
)
Opcional. Metadados personalizados fornecidos pelo usuário armazenados como pares de chave-valor. O número máximo de CustomMetadata
por bloco é 20.
Corpo da resposta
Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Chunk
.
Método: corpora.documents.chunks.delete
Exclui um Chunk
.
Endpoint
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /* /documents /* /chunks /*}
Parâmetros de caminho
name
string
Obrigatório. O nome do recurso do Chunk
a ser excluído. Exemplo: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
. Ele assume a forma corpora/{corpora}/documents/{document}/chunks/{chunk}
.
Corpo da solicitação
O corpo da solicitação precisa estar vazio.
Corpo da resposta
Se não houver nenhum problema, o corpo da resposta será um objeto JSON vazio.
Método: corpora.documents.chunks.batchCreate
- Endpoint
- Parâmetros de caminho
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
- CreateChunkRequest
Criação em lote de Chunk
s.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchCreate
Parâmetros de caminho
parent
string
Opcional. O nome do Document
em que este lote de Chunk
s será criado. O campo "parent" em cada CreateChunkRequest
precisa corresponder a esse valor. Exemplo: corpora/my-corpus-123/documents/the-doc-abc
. Ele assume a forma corpora/{corpora}/documents/{document}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
requests[]
object (CreateChunkRequest
)
Obrigatório. As mensagens de solicitação que especificam os Chunk
s a serem criados. É possível criar no máximo 100 Chunk
s em um lote.
Corpo da resposta
Resposta de chunks.batchCreate
contendo uma lista de Chunk
s criados.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
chunks[]
object (Chunk
)
Chunk
s criados.
Representação JSON |
---|
{
"chunks": [
{
object ( |
CreateChunkRequest
Método: corpora.documents.chunks.batchUpdate
- Endpoint
- Parâmetros de caminho
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
- UpdateChunkRequest
Atualiza em lote Chunk
s.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchUpdate
Parâmetros de caminho
parent
string
Opcional. O nome do Document
que contém os Chunk
s a serem atualizados. O campo "parent" em cada UpdateChunkRequest
precisa corresponder a esse valor. Exemplo: corpora/my-corpus-123/documents/the-doc-abc
. Ele assume a forma corpora/{corpora}/documents/{document}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
requests[]
object (UpdateChunkRequest
)
Obrigatório. As mensagens de solicitação que especificam os Chunk
s a serem atualizados. É possível atualizar até 100 Chunk
s em um lote.
Corpo da resposta
Resposta de chunks.batchUpdate
contendo uma lista de Chunk
s atualizados.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
chunks[]
object (Chunk
)
Chunk
s atualizados.
Representação JSON |
---|
{
"chunks": [
{
object ( |
UpdateChunkRequest
Solicitação para atualizar um Chunk
.
chunk
object (Chunk
)
Obrigatório. O Chunk
a ser atualizado.
updateMask
string (FieldMask
format)
Obrigatório. Lista de campos a serem atualizados. No momento, isso só permite atualizar customMetadata
e data
.
É uma lista separada por vírgulas de nomes de campos totalmente qualificados. Exemplo: "user.displayName,photo"
.
Representação JSON |
---|
{
"chunk": {
object ( |
Método: corpora.documents.chunks.batchDelete
- Endpoint
- Parâmetros de caminho
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
- DeleteChunkRequest
Exclui Chunk
s em lote.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchDelete
Parâmetros de caminho
parent
string
Opcional. O nome do Document
que contém os Chunk
s a serem excluídos. O campo "parent" em cada DeleteChunkRequest
precisa corresponder a esse valor. Exemplo: corpora/my-corpus-123/documents/the-doc-abc
. Ele assume a forma corpora/{corpora}/documents/{document}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
requests[]
object (DeleteChunkRequest
)
Obrigatório. As mensagens de solicitação que especificam os Chunk
s a serem excluídos.
Corpo da resposta
Se não houver nenhum problema, o corpo da resposta será um objeto JSON vazio.
DeleteChunkRequest
Solicitação para excluir um Chunk
.
name
string
Obrigatório. O nome do recurso do Chunk
a ser excluído. Exemplo: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
Representação JSON |
---|
{ "name": string } |
Recurso REST: corpora.documents.chunks
Recurso: Chunk
Um Chunk
é uma subparte de um Document
que é tratado como uma unidade independente para fins de representação e armazenamento de vetores. Um Corpus
pode ter no máximo um milhão de Chunk
s.
name
string
Imutável. Identificador. O nome do recurso Chunk
. O ID (nome sem o prefixo "corpora/*/documents/*/chunks/") pode conter até 40 caracteres alfanuméricos minúsculos ou traços (-). O ID não pode começar nem terminar com um traço. Se o nome estiver vazio na criação, um ID exclusivo aleatório de 12 caracteres será gerado. Exemplo: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
data
object (ChunkData
)
Obrigatório. O conteúdo do Chunk
, como a string de texto. O número máximo de tokens por bloco é 2.043.
customMetadata[]
object (CustomMetadata
)
Opcional. Metadados personalizados fornecidos pelo usuário armazenados como pares de chave-valor. O número máximo de CustomMetadata
por bloco é 20.
createTime
string (Timestamp
format)
Apenas saída. O carimbo de data/hora de quando o Chunk
foi criado.
Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de "Z", outros ajustes também são aceitos. Exemplos: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
ou "2014-10-02T15:01:23+05:30"
.
updateTime
string (Timestamp
format)
Apenas saída. O carimbo de data/hora da última atualização do Chunk
.
Usa o padrão RFC 3339, em que a saída gerada é sempre convertida em Z e tem 0, 3, 6 ou 9 dígitos fracionários. Além de "Z", outros ajustes também são aceitos. Exemplos: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
ou "2014-10-02T15:01:23+05:30"
.
state
enum (State
)
Apenas saída. Estado atual do Chunk
.
Representação JSON |
---|
{ "name": string, "data": { object ( |
ChunkData
Dados extraídos que representam o conteúdo Chunk
.
data
Union type
data
pode ser apenas de um dos tipos a seguir:stringValue
string
O conteúdo Chunk
como uma string. O número máximo de tokens por bloco é 2.043.
Representação JSON |
---|
{ // data "stringValue": string // Union type } |
Estado
Estados do ciclo de vida de um Chunk
.
Enums | |
---|---|
STATE_UNSPECIFIED |
O valor padrão. Esse valor é usado se o estado for omitido. |
STATE_PENDING_PROCESSING |
Chunk está sendo processado (armazenamento de embeddings e vetores). |
STATE_ACTIVE |
Chunk é processado e fica disponível para consulta. |
STATE_FAILED |
Falha no processamento de Chunk . |