Corpora

Método: corpora.create

Cria uma Corpus vazia.

Endpoint

post https://generativelanguage.googleapis.com/v1beta/corpora

O URL usa a sintaxe de transcodificação gRPC.

Corpo da solicitação

O corpo da solicitação contém uma instância de Corpus.

Campos
name string

Imutável. Identificador. O nome do recurso Corpus. O ID (nome, excluindo o prefixo "corpora/") pode conter até 40 caracteres alfanuméricos minúsculos ou hifens (-). O ID não pode começar ou terminar com um hífen. Se o nome estiver vazio na criação, um nome exclusivo será derivado de displayName com um sufixo aleatório de 12 caracteres. Exemplo: corpora/my-awesome-corpora-123a456b789c

displayName string

Opcional. O nome de exibição legível para humanos do Corpus. O nome de exibição não pode ter mais de 512 caracteres, incluindo espaços. Exemplo: "Documentos sobre o Semantic Retriever"

Corpo da resposta

Se a solicitação for bem-sucedida, o corpo da resposta incluirá uma instância de Corpus.

Método: corpora.query

Realiza pesquisa semântica em um Corpus.

Endpoint

post https://generativelanguage.googleapis.com/v1beta/{name=corpora/*}:query

O URL usa a sintaxe de transcodificação gRPC.

Parâmetros de caminho

name string

Obrigatório. O nome do Corpus a ser consultado. Exemplo: corpora/my-corpus-123 Ele assume a forma corpora/{corpora}.

Corpo da solicitação

O corpo da solicitação contém dados com a seguinte estrutura:

Campos
query string

Obrigatório. String de consulta para realizar uma pesquisa semântica.

metadataFilters[] object (MetadataFilter)

Opcional. Filtre os metadados Chunk e Document. Cada objeto MetadataFilter precisa corresponder a uma chave exclusiva. Vários objetos MetadataFilter são unidos por "AND" lógicas.

Exemplo de consulta no nível do documento: (year >= 2020 OR year < 2010) AND (genre = drama OR genre = action)

Lista de objetos MetadataFilter: metadataFilters = [ {key = "document.custom_metadata.year" conditions = [{int_value = 2020, operation = GREATER_EQUAL}, {int_value = 2010, operation = LESS}]}, {key = "document.custom_metadata.year" conditions = [{int_value = 2020, operation = GREATER_EQUAL}, {int_value = 2010, operation = LESS}]}, {key = "document.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}]}]

Exemplo de consulta no nível do bloco para um intervalo numérico de valores: (year > 2015 AND year <= 2020)

Lista de objetos MetadataFilter: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2015, operation = GREATER}]}, {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = LESS_EQUAL}]}]

Observação: "AND"s para a mesma chave só são aceitos para valores numéricos. Os valores de string só aceitam "OR"s para a mesma chave.

resultsCount integer

Opcional. O número máximo de Chunks a serem retornados. O serviço pode retornar menos Chunks.

Se não for especificado, no máximo 10 Chunks serão retornados. A contagem máxima de resultados especificados é 100.

Corpo da resposta

Resposta de corpora.query contendo uma lista de blocos relevantes.

Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:

Campos
relevantChunks[] object (RelevantChunk)

Os pedaços relevantes.

Representação JSON
{
  "relevantChunks": [
    {
      object (RelevantChunk)
    }
  ]
}

Método: corpora.list

Lista todos os Corpora pertencentes ao usuário.

Endpoint

get https://generativelanguage.googleapis.com/v1beta/corpora

O URL usa a sintaxe de transcodificação gRPC.

Parâmetros de consulta

pageSize integer

Opcional. O número máximo de Corpora a serem retornados (por página). O serviço pode retornar menos Corpora.

Se não for especificado, no máximo 10 Corpora serão retornados. O limite máximo de tamanho é de 20 Corpora por página.

pageToken string

Opcional. Um token de página recebido de uma chamada corpora.list anterior.

Forneça o nextPageToken retornado na resposta como um argumento para a próxima solicitação para recuperar a próxima página.

Ao paginar, todos os outros parâmetros fornecidos para corpora.list precisam corresponder à chamada que forneceu o token da página.

Corpo da solicitação

O corpo da solicitação precisa estar vazio.

Corpo da resposta

Resposta de corpora.list contendo uma lista paginada de Corpora. Os resultados são classificados por corpus.create_time crescente.

Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:

Campos
corpora[] object (Corpus)

Os corpora retornados.

nextPageToken string

Um token, que pode ser enviado como pageToken para recuperar a próxima página. Se esse campo for omitido, não haverá mais páginas.

Representação JSON
{
  "corpora": [
    {
      object (Corpus)
    }
  ],
  "nextPageToken": string
}

Método: corpora.get

Recebe informações sobre um Corpus específico.

Endpoint

get https://generativelanguage.googleapis.com/v1beta/{name=corpora/*}

O URL usa a sintaxe de transcodificação gRPC.

Parâmetros de caminho

name string

Obrigatório. O nome do Corpus. Exemplo: corpora/my-corpus-123 Ele assume a forma corpora/{corpora}.

Corpo da solicitação

O corpo da solicitação precisa estar vazio.

Corpo da resposta

Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Corpus.

Método: corpora.patch

Atualiza um Corpus.

Endpoint

patch https://generativelanguage.googleapis.com/v1beta/{corpus.name=corpora/*}

PATCH https://generativelanguage.googleapis.com/v1beta/{corpus.name=corpora/*}

O URL usa a sintaxe de transcodificação gRPC.

Parâmetros de caminho

corpus.name string

Imutável. Identificador. O nome do recurso Corpus. O ID (nome, excluindo o prefixo "corpora/") pode conter até 40 caracteres alfanuméricos minúsculos ou hifens (-). O ID não pode começar ou terminar com um hífen. Se o nome estiver vazio durante a criação, um nome exclusivo será derivado de displayName com um sufixo aleatório de 12 caracteres. Exemplo: corpora/my-awesome-corpora-123a456b789c Ele assume a forma corpora/{corpora}.

Parâmetros de consulta

updateMask string (FieldMask format)

Obrigatório. Lista de campos a serem atualizados. No momento, isso só é compatível com a atualização de displayName.

É uma lista separada por vírgulas de nomes de campos totalmente qualificados. Exemplo: "user.displayName,photo".

Corpo da solicitação

O corpo da solicitação contém uma instância de Corpus.

Campos
displayName string

Opcional. O nome de exibição legível para humanos do Corpus. O nome de exibição não pode ter mais de 512 caracteres, incluindo espaços. Exemplo: "Documentos sobre o Semantic Retriever"

Corpo da resposta

Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Corpus.

Método: corpora.delete

Exclui um Corpus.

Endpoint

delete https://generativelanguage.googleapis.com/v1beta/{name=corpora/*}

O URL usa a sintaxe de transcodificação gRPC.

Parâmetros de caminho

name string

Obrigatório. O nome do recurso do Corpus. Exemplo: corpora/my-corpus-123 Ele assume a forma corpora/{corpora}.

Parâmetros de consulta

force boolean

Opcional. Se definido como verdadeiro, todos os Documents e objetos relacionados a esse Corpus também serão excluídos.

Se for falso (padrão), um erro FAILED_PRECONDITION será retornado se Corpus contiver Documents.

Corpo da solicitação

O corpo da solicitação precisa estar vazio.

Corpo da resposta

Se a solicitação for concluída, o corpo da resposta estará vazio.

Recurso REST: corpora.permissions

Recurso: permissão

O recurso de permissão concede ao usuário, grupo ou ao mundo acesso ao recurso da API PaLM (por exemplo, um modelo ajustado, corpus).

Um papel é um conjunto de operações permitidas que permite que os usuários realizem ações específicas nos recursos da API PaLM. Para disponibilizar essas permissões a usuários, grupos ou contas de serviço, atribua papéis. Ao atribuir um papel, você concede as permissões que ele contém.

Há três papéis concêntricos. Cada papel é um superconjunto das operações permitidas pelo papel anterior:

  • O leitor pode usar o recurso (por exemplo, modelo ajustado, corpus) para inferência
  • O autor tem as permissões de leitor e também pode editar e compartilhar
  • O proprietário tem as permissões de um colaborador e também pode excluir
Campos
name string

Apenas saída. Identificador. O nome da permissão. Um nome exclusivo será gerado na criação. Exemplos: tunedModels/{tunedModel}/permissions/{permission} corpora/{corpus}/permissions/{permission} Apenas saída.

granteeType enum (GranteeType)

Opcional. Imutável. O tipo de beneficiário.

emailAddress string

Opcional. Imutável. O endereço de e-mail do usuário do grupo a que esta permissão se refere. O campo não é definido quando o tipo de concessão de permissão é TODOS.

role enum (Role)

Obrigatório. O papel concedido pela permissão.

Representação JSON
{
  "name": string,
  "granteeType": enum (GranteeType),
  "emailAddress": string,
  "role": enum (Role)
}

GranteeType

Define os tipos de beneficiário dessa permissão.

Enums
GRANTEE_TYPE_UNSPECIFIED O valor padrão. Esse valor não é usado.
USER Representa um usuário. Quando definido, você precisa fornecer o emailAddress do usuário.
GROUP Representa um grupo. Quando definido, é necessário fornecer o emailAddress do grupo.
EVERYONE Representa o acesso de todos. Não é necessário enviar mais informações.

Papel

Define o papel concedido por essa permissão.

Enums
ROLE_UNSPECIFIED O valor padrão. Esse valor não é usado.
OWNER O proprietário pode usar, atualizar, compartilhar e excluir o recurso.
WRITER O redator pode usar, atualizar e compartilhar o recurso.
READER O leitor pode usar o recurso.

MetadataFilter

Filtro fornecido pelo usuário para limitar a recuperação com base nos valores de metadados do nível Chunk ou Document. Exemplo (gênero = drama OU gênero = ação): key = "document.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}]

Campos
key string

Obrigatório. A chave dos metadados que serão filtrados.

conditions[] object (Condition)

Obrigatório. Os Conditions da chave especificada que acionarão esse filtro. Várias Conditions são agrupadas por ORs lógicas.

Representação JSON
{
  "key": string,
  "conditions": [
    {
      object (Condition)
    }
  ]
}

Condição

Condição de filtro aplicável a uma única chave.

Campos
operation enum (Operator)

Obrigatório. Operador aplicado ao par de chave-valor especificado para acionar a condição.

value Union type
O tipo de valor precisa ser consistente com o tipo de valor definido no campo para a chave correspondente. Se os tipos de valor não forem consistentes, o resultado será um conjunto vazio. Quando o CustomMetadata tem um tipo de valor StringList, a condição de filtragem precisa usar string_value com uma operação INCLUDES/EXCLUDES. Caso contrário, o resultado também será um conjunto vazio. value pode ser apenas um dos seguintes:
stringValue string

O valor da string para filtrar os metadados.

numericValue number

O valor numérico para filtrar os metadados.

Representação JSON
{
  "operation": enum (Operator),

  // value
  "stringValue": string,
  "numericValue": number
  // Union type
}

Operador

Define os operadores válidos que podem ser aplicados a um par de chave-valor.

Enums
OPERATOR_UNSPECIFIED O valor padrão. Esse valor não é usado.
LESS Suporte para números.
LESS_EQUAL Suporte para números.
EQUAL Suporte para números e strings.
GREATER_EQUAL Suporte para números.
GREATER Suporte para números.
NOT_EQUAL Suporte para números e strings.
INCLUDES A string é aceita apenas quando o tipo de valor CustomMetadata da chave especificada tem um stringListValue.
EXCLUDES A string é aceita apenas quando o tipo de valor CustomMetadata da chave especificada tem um stringListValue.

RelevantChunk

As informações de um bloco relevante para uma consulta.

Campos
chunkRelevanceScore number

Chunk relevância para a consulta.

chunk object (Chunk)

Chunk associado à consulta.

Representação JSON
{
  "chunkRelevanceScore": number,
  "chunk": {
    object (Chunk)
  }
}

Recurso REST: corpora

Recurso: corpus

Um Corpus é uma coleção de Documents. Um projeto pode criar até cinco corpora.

Campos
name string

Imutável. Identificador. O nome do recurso Corpus. O ID (nome, excluindo o prefixo "corpora/") pode conter até 40 caracteres alfanuméricos minúsculos ou hifens (-). O ID não pode começar ou terminar com um hífen. Se o nome estiver vazio na criação, um nome exclusivo será derivado de displayName com um sufixo aleatório de 12 caracteres. Exemplo: corpora/my-awesome-corpora-123a456b789c

displayName string

Opcional. O nome de exibição legível para humanos do Corpus. O nome de exibição não pode ter mais de 512 caracteres, incluindo espaços. Exemplo: "Documentos sobre o Semantic Retriever"

createTime string (Timestamp format)

Apenas saída. O carimbo de data/hora de quando o Corpus foi criado.

Um carimbo de data/hora no formato RFC3339 UTC "Zulu", com resolução de nanossegundos e até nove dígitos fracionários. Exemplos: "2014-10-02T15:01:23Z" e "2014-10-02T15:01:23.045123456Z".

updateTime string (Timestamp format)

Apenas saída. O carimbo de data/hora da última atualização do Corpus.

Um carimbo de data/hora no formato RFC3339 UTC "Zulu", com resolução de nanossegundos e até nove dígitos fracionários. Exemplos: "2014-10-02T15:01:23Z" e "2014-10-02T15:01:23.045123456Z".

Representação JSON
{
  "name": string,
  "displayName": string,
  "createTime": string,
  "updateTime": string
}