资源:数据块
Chunk
是 Document
的子部分,在向量表示和存储时被视为独立单元。一个 Corpus
最多可以有 100 万个 Chunk
。
JSON 表示法 |
---|
{ "name": string, "data": { object ( |
字段 | |
---|---|
name |
不可变。标识符。 |
data |
必需。 |
customMetadata[] |
可选。用户提供的自定义元数据以键值对的形式存储。每个分块的 |
createTime |
仅供输出。创建 时间戳,采用 RFC3339 世界协调时间 (UTC)(即“祖鲁时”)格式,具有纳秒级分辨率,最多包含九个小数位。示例: |
updateTime |
仅供输出。 时间戳,采用 RFC3339 世界协调时间 (UTC)(即“祖鲁时”)格式,具有纳秒级分辨率,最多包含九个小数位。示例: |
state |
仅供输出。 |
ChunkData
提取的表示 Chunk
内容的数据。
JSON 表示法 |
---|
{ // Union field |
字段 | |
---|---|
联合字段
|
|
stringValue |
字符串形式的 |
状态
Chunk
生命周期的状态。
枚举 | |
---|---|
STATE_UNSPECIFIED |
默认值。如果省略状态,则使用此值。 |
STATE_PENDING_PROCESSING |
正在处理 Chunk (嵌入和矢量存储)。 |
STATE_ACTIVE |
Chunk 已处理完毕并可供查询。 |
STATE_FAILED |
Chunk 处理失败。 |
方法 |
|
---|---|
|
批量创建 Chunk 。 |
|
批量删除 Chunk 。 |
|
批量更新 Chunk 。 |
|
创建 Chunk 。 |
|
删除 Chunk 。 |
|
获取有关特定 Chunk 的信息。 |
|
列出 Document 中的所有 Chunk 。 |
|
更新 Chunk 。 |