REST Resource: corpora.documents.chunks

منبع: تکه

یک Chunk بخشی فرعی از یک Document است که به عنوان یک واحد مستقل برای اهداف نمایش برداری و ذخیره سازی در نظر گرفته می شود. یک Corpus حداکثر می تواند 1 میلیون Chunk داشته باشد.

نمایندگی JSON
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}
زمینه های
name

string

تغییرناپذیر. مشخص کننده. نام منبع Chunk . شناسه (نام بدون پیشوند "corpora/*/documents/*/chunks/") می‌تواند حداکثر دارای 40 کاراکتر باشد که حروف عددی کوچک یا خط تیره (-) هستند. شناسه نمی تواند با خط تیره شروع یا پایان یابد. اگر نام در هنگام ایجاد خالی باشد، یک شناسه منحصربه‌فرد 12 نویسه‌ای تصادفی ایجاد می‌شود. مثال: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data

object ( ChunkData )

ضروری. محتوای Chunk ، مانند رشته متن. حداکثر تعداد توکن در هر تکه 2043 است.

customMetadata[]

object ( CustomMetadata )

اختیاری. کاربر فوق داده های سفارشی را که به صورت جفت کلید-مقدار ذخیره می شود، ارائه می کند. حداکثر تعداد CustomMetadata در هر تکه 20 عدد است.

createTime

string ( Timestamp format)

فقط خروجی مهر زمانی مربوط به زمان ایجاد Chunk .

مهر زمانی در قالب RFC3339 UTC "Zulu"، با وضوح نانوثانیه و حداکثر نه رقم کسری. مثال‌ها: "2014-10-02T15:01:23Z" و "2014-10-02T15:01:23.045123456Z" .

updateTime

string ( Timestamp format)

فقط خروجی مُهر زمانی آخرین به‌روزرسانی Chunk .

مهر زمانی در قالب RFC3339 UTC "Zulu"، با وضوح نانوثانیه و حداکثر نه رقم کسری. مثال‌ها: "2014-10-02T15:01:23Z" و "2014-10-02T15:01:23.045123456Z" .

state

enum ( State )

فقط خروجی وضعیت فعلی Chunk

ChunkData

داده های استخراج شده که نشان دهنده محتوای Chunk است.

نمایندگی JSON
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}
زمینه های

data میدان اتحادیه

data فقط می توانند یکی از موارد زیر باشند:

stringValue

string

محتوای Chunk به عنوان یک رشته. حداکثر تعداد توکن در هر تکه 2043 است.

حالت

حالات برای چرخه حیات یک Chunk

Enums
STATE_UNSPECIFIED مقدار پیش فرض اگر حالت حذف شود از این مقدار استفاده می شود.
STATE_PENDING_PROCESSING Chunk در حال پردازش است (جاسازی و ذخیره سازی برداری).
STATE_ACTIVE Chunk پردازش شده و برای پرس و جو در دسترس است.
STATE_FAILED پردازش Chunk ناموفق بود.

مواد و روش ها

batchCreate

دسته ای ایجاد Chunk s.

batchDelete

حذف دسته ای Chunk s.

batchUpdate

به روز رسانی دسته ای Chunk s.

create

یک Chunk ایجاد می کند.

delete

یک Chunk را حذف می کند.

get

اطلاعات مربوط به یک Chunk خاص را دریافت می کند.

list

تمام Chunk یک Document را فهرست می کند.

patch

یک Chunk را به روز می کند.