REST Resource: corpora.documents.chunks

المرجع: مقطع

Chunk هو جزء فرعي من Document تتم معالجته كوحدة مستقلة لأغراض تمثيل المتجهات وتخزينها. يمكن أن تحتوي Corpus على مليون Chunk كحدّ أقصى.

تمثيل JSON
{
  "name": string,
  "data": {
    object (ChunkData)
  },
  "customMetadata": [
    {
      object (CustomMetadata)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "state": enum (State)
}
الحقول
name

string

غير قابل للتغيير. المعرّف. اسم المورد Chunk. يمكن أن يحتوي رقم التعريف (الاسم باستثناء البادئة "corpora/*/documents/*/chunk/" ) على ما يصل إلى 40 حرفًا أبجديًا رقميًا أو شرطات (-). ولا يمكن أن يبدأ رقم التعريف بشرطة أو أن ينتهي. إذا لم يكن الاسم فارغًا عند الإنشاء، سيتم إنشاء معرّف فريد عشوائي مكوَّن من 12 حرفًا. مثال: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c

data

object (ChunkData)

مطلوبة. محتوى Chunk، مثل السلسلة النصية. الحد الأقصى لعدد الرموز المميّزة في كل مقطع هو 2043.

customMetadata[]

object (CustomMetadata)

اختياريّ. قدَّم المستخدم البيانات الوصفية المخصّصة المخزَّنة كأزواج المفتاح/القيمة. الحد الأقصى لعدد الأحرف CustomMetadata في كل مقطع هو 20.

createTime

string (Timestamp format)

النتائج فقط. الطابع الزمني لوقت إنشاء Chunk.

طابع زمني بتنسيق RFC3339 UTC "Zulu" ، بدقة نانو ثانية وما يصل إلى تسعة أرقام كسرية. أمثلة: "2014-10-02T15:01:23Z" و"2014-10-02T15:01:23.045123456Z"

updateTime

string (Timestamp format)

النتائج فقط. الطابع الزمني لوقت آخر تعديل لـ Chunk.

طابع زمني بتنسيق RFC3339 UTC "Zulu" ، بدقة نانو ثانية وما يصل إلى تسعة أرقام كسرية. أمثلة: "2014-10-02T15:01:23Z" و"2014-10-02T15:01:23.045123456Z"

state

enum (State)

النتائج فقط. حالة Chunk الحالية

ChunkData

البيانات المستخرجة التي تمثل محتوى Chunk.

تمثيل JSON
{

  // Union field data can be only one of the following:
  "stringValue": string
  // End of list of possible types for union field data.
}
الحقول

حقل الاتحاد data

يمكن أن تكون السمة "data" واحدة فقط مما يلي:

stringValue

string

محتوى Chunk كسلسلة. الحد الأقصى لعدد الرموز المميّزة في كل مقطع هو 2043.

الحالة

تمثّل هذه السمة دورة حياة Chunk.

عمليات التعداد
STATE_UNSPECIFIED القيمة التلقائية. يتم استخدام هذه القيمة إذا تم حذف الحالة.
STATE_PENDING_PROCESSING تتم الآن معالجة Chunk (التضمين وتخزين المتجهات).
STATE_ACTIVE تمت معالجة Chunk وهو متاح لطلب البحث.
STATE_FAILED تعذّرت معالجة Chunk.

الطُرق

batchCreate

إنشاء Chunk بشكل مجمّع

batchDelete

حذف مجمّع Chunk ثانية

batchUpdate

التعديلات المجمّعة Chunk ثانية.

create

تنشئ Chunk.

delete

حذف Chunk

get

الحصول على معلومات عن Chunk معيّن

list

يسرد كل Chunk في Document.

patch

لتعديل Chunk