Метод: corpora.documents.chunks.create
Создает Chunk
.
Конечная точка
постhttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks
Параметры пути
parent
string
Обязательно. Имя Document
, в котором будет создан этот Chunk
. Пример: corpora/my-corpus-123/documents/the-doc-abc
Имя имеет вид corpora/{corpora}/documents/{document}
.
Текст запроса
Тело запроса содержит экземпляр Chunk
.
string
name
Неизменяемый. Идентификатор. Имя ресурса Chunk
. Идентификатор (имя без префикса "corpora/*/documents/*/chunks/") может содержать до 40 строчных букв, цифр или дефисов (-). Идентификатор не может начинаться или заканчиваться дефисом. Если при создании имя пустое, будет сгенерирован случайный уникальный идентификатор из 12 символов. Пример: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
data
object ( ChunkData
)
Обязательно. Содержимое Chunk
, например, текстовая строка. Максимальное количество токенов в фрагменте — 2043.
object ( CustomMetadata )
customMetadata[]
Необязательно. Пользовательские метаданные хранятся в виде пар «ключ-значение». Максимальное количество CustomMetadata
в блоке — 20.
Тело ответа
В случае успеха тело ответа содержит вновь созданный экземпляр Chunk
.
Метод: corpora.documents.chunks.list
Выводит список всех Chunk
в Document
.
Конечная точка
получитьhttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks
Параметры пути
parent
string
Обязательно. Имя Document
, содержащего Chunk
. Пример: corpora/my-corpus-123/documents/the-doc-abc
Оно имеет вид corpora/{corpora}/documents/{document}
.
Параметры запроса
pageSize
integer
Необязательно. Максимальное количество возвращаемых Chunk
(на страницу). Сервис может возвращать меньше Chunk
.
Если не указано иное, будет возвращено не более 10 Chunk
. Максимальный размер — 100 Chunk
на страницу.
string
pageToken
Необязательно. Токен страницы, полученный в результате предыдущего вызова chunks.list
.
Предоставьте nextPageToken
возвращенный в ответе, в качестве аргумента для следующего запроса для получения следующей страницы.
При пагинации все остальные параметры, предоставленные chunks.list
, должны соответствовать вызову, который предоставил токен страницы.
Текст запроса
Тело запроса должно быть пустым.
Тело ответа
Ответ от chunks.list
содержащий постраничный список фрагментов ( Chunk
). Chunk
отсортированы по возрастанию chunk.create_time
.
В случае успеха тело ответа содержит данные со следующей структурой:
chunks[]
object ( Chunk
)
Возвращенный Chunk
s.
string
nextPageToken
Токен, который можно отправить как pageToken
для получения следующей страницы. Если это поле пропущено, значит, страниц больше нет.
JSON-представление |
---|
{
"chunks": [
{
object ( |
Метод: corpora.documents.chunks.get
Получает информацию о конкретном Chunk
.
Конечная точка
получитьhttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /* /documents /* /chunks /*}
Параметры пути
string
name
Обязательно. Имя извлекаемого Chunk
. Пример: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
Формат corpora/{corpora}/documents/{document}/chunks/{chunk}
.
Текст запроса
Тело запроса должно быть пустым.
Тело ответа
В случае успеха тело ответа содержит экземпляр Chunk
.
Метод: corpora.documents.chunks.patch
Обновляет Chunk
.
Конечная точка
патчhttps: / /generativelanguage.googleapis.com /v1beta /{chunk.name=corpora /* /documents /* /chunks /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}
Параметры пути
string
chunk.name
Неизменяемый. Идентификатор. Имя ресурса Chunk
. Идентификатор (имя без префикса "corpora/*/documents/*/chunks/") может содержать до 40 строчных букв, цифр или дефисов (-). Идентификатор не может начинаться или заканчиваться дефисом. Если при создании имя пустое, будет сгенерирован случайный уникальный идентификатор из 12 символов. Пример: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
Он имеет вид corpora/{corpora}/documents/{document}/chunks/{chunk}
.
Параметры запроса
string ( FieldMask format)
updateMask
Обязательно. Список полей для обновления. В настоящее время поддерживается только обновление customMetadata
и data
.
Это список полных имён полей, разделённых запятыми. Пример: "user.displayName,photo"
.
Текст запроса
Тело запроса содержит экземпляр Chunk
.
data
object ( ChunkData
)
Обязательно. Содержимое Chunk
, например, текстовая строка. Максимальное количество токенов в фрагменте — 2043.
object ( CustomMetadata )
customMetadata[]
Необязательно. Пользовательские метаданные хранятся в виде пар «ключ-значение». Максимальное количество CustomMetadata
в блоке — 20.
Тело ответа
В случае успеха тело ответа содержит экземпляр Chunk
.
Метод: corpora.documents.chunks.delete
Удаляет Chunk
.
Конечная точка
удалитьhttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /* /documents /* /chunks /*}
Параметры пути
string
name
Обязательно. Имя ресурса удаляемого Chunk
. Пример: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
Формат corpora/{corpora}/documents/{document}/chunks/{chunk}
.
Текст запроса
Тело запроса должно быть пустым.
Тело ответа
В случае успеха тело ответа представляет собой пустой объект JSON.
Метод: corpora.documents.chunks.batchCreate
Пакетное создание Chunk
.
Конечная точка
постhttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchCreate
Параметры пути
parent
string
Необязательно. Имя Document
, в котором будет создан этот пакет фрагментов Chunk
). Родительское поле в каждом CreateChunkRequest
должно соответствовать этому значению. Пример: corpora/my-corpus-123/documents/the-doc-abc
Оно имеет вид corpora/{corpora}/documents/{document}
.
Текст запроса
Тело запроса содержит данные со следующей структурой:
requests[]
object ( CreateChunkRequest
)
Обязательно. Сообщения-запросы, указывающие Chunk
для создания. В одном пакете можно создать не более 100 Chunk
.
Тело ответа
Ответ от chunks.batchCreate
, содержащий список созданных Chunk
.
В случае успеха тело ответа содержит данные со следующей структурой:
chunks[]
object ( Chunk
)
Chunk
создан.
JSON-представление |
---|
{
"chunks": [
{
object ( |
CreateChunkRequest
Запрос на создание Chunk
.
parent
string
Обязательно. Имя Document
, в котором будет создан этот Chunk
. Пример: corpora/my-corpus-123/documents/the-doc-abc
chunk
object ( Chunk
)
Обязательно. Chunk
, который нужно создать.
JSON-представление |
---|
{
"parent": string,
"chunk": {
object ( |
Метод: corpora.documents.chunks.batchUpdate
Пакетное обновление Chunk
.
Конечная точка
постhttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchUpdate
Параметры пути
parent
string
Необязательно. Имя Document
, содержащего обновляемые Chunk
. Родительское поле в каждом UpdateChunkRequest
должно соответствовать этому значению. Пример: corpora/my-corpus-123/documents/the-doc-abc
Оно имеет вид corpora/{corpora}/documents/{document}
.
Текст запроса
Тело запроса содержит данные со следующей структурой:
requests[]
object ( UpdateChunkRequest
)
Обязательно. Сообщения-запросы, указывающие Chunk
для обновления. За один пакет можно обновить не более 100 Chunk
.
Тело ответа
Ответ от chunks.batchUpdate
, содержащий список обновленных Chunk
.
В случае успеха тело ответа содержит данные со следующей структурой:
chunks[]
object ( Chunk
)
Chunk
обновлен.
JSON-представление |
---|
{
"chunks": [
{
object ( |
UpdateChunkRequest
Запрос на обновление Chunk
.
chunk
object ( Chunk
)
Обязательно. Chunk
для обновления.
string ( FieldMask format)
updateMask
Обязательно. Список полей для обновления. В настоящее время поддерживается только обновление customMetadata
и data
.
Это список полных имён полей, разделённых запятыми. Пример: "user.displayName,photo"
.
JSON-представление |
---|
{
"chunk": {
object ( |
Метод: corpora.documents.chunks.batchDelete
Пакетное удаление Chunk
.
Конечная точка
постhttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchDelete
Параметры пути
parent
string
Необязательно. Имя Document
, содержащего удаляемые Chunk
. Родительское поле в каждом DeleteChunkRequest
должно совпадать с этим значением. Пример: corpora/my-corpus-123/documents/the-doc-abc
Оно имеет вид corpora/{corpora}/documents/{document}
.
Текст запроса
Тело запроса содержит данные со следующей структурой:
requests[]
object ( DeleteChunkRequest
)
Обязательно. Сообщения-запросы, указывающие Chunk
, которые необходимо удалить.
Тело ответа
В случае успеха тело ответа представляет собой пустой объект JSON.
DeleteChunkRequest
Запрос на удаление Chunk
.
string
name
Обязательно. Имя ресурса Chunk
, который нужно удалить. Пример: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
JSON-представление |
---|
{ "name": string } |
Ресурс REST: corpora.documents.chunks
Ресурс: Кусок
Chunk
— это часть Document
, которая рассматривается как независимая единица для целей векторного представления и хранения. Corpus
может содержать не более 1 миллиона блоков Chunk
).
string
name
Неизменяемый. Идентификатор. Имя ресурса Chunk
. Идентификатор (имя без префикса "corpora/*/documents/*/chunks/") может содержать до 40 строчных букв, цифр или дефисов (-). Идентификатор не может начинаться или заканчиваться дефисом. Если при создании имя пустое, будет сгенерирован случайный уникальный идентификатор из 12 символов. Пример: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
data
object ( ChunkData
)
Обязательно. Содержимое Chunk
, например, текстовая строка. Максимальное количество токенов в фрагменте — 2043.
object ( CustomMetadata )
customMetadata[]
Необязательно. Пользовательские метаданные хранятся в виде пар «ключ-значение». Максимальное количество CustomMetadata
в блоке — 20.
createTime
string ( Timestamp
format)
Только вывод. Отметка времени создания Chunk
.
Использует RFC 3339, согласно которому сгенерированный вывод всегда будет нормализован по оси Z и содержать 0, 3, 6 или 9 знаков после запятой. Также допускаются смещения, отличные от «Z». Примеры: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
или "2014-10-02T15:01:23+05:30"
.
updateTime
string ( Timestamp
format)
Только вывод. Отметка времени последнего обновления Chunk
.
Использует RFC 3339, согласно которому сгенерированный вывод всегда будет нормализован по оси Z и содержать 0, 3, 6 или 9 знаков после запятой. Также допускаются смещения, отличные от «Z». Примеры: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
или "2014-10-02T15:01:23+05:30"
.
state
enum ( State
)
Только вывод. Текущее состояние Chunk
.
JSON-представление |
---|
{ "name": string, "data": { object ( |
ChunkData
Извлеченные данные, представляющие содержимое Chunk
.
Union type
data
data
могут быть только одним из следующих:stringValue
string
Содержимое Chunk
в виде строки. Максимальное количество токенов в фрагменте — 2043.
JSON-представление |
---|
{ // data "stringValue": string // Union type } |
Состояние
Состояния жизненного цикла Chunk
.
Перечисления | |
---|---|
STATE_UNSPECIFIED | Значение по умолчанию. Используется, если состояние не указано. |
STATE_PENDING_PROCESSING | Chunk обрабатывается (внедрение и векторное хранение). |
STATE_ACTIVE | Chunk обработан и доступен для запроса. |
STATE_FAILED | Обработка Chunk не удалась. |