שיטה: corpora.documents.chunks.create
יוצר Chunk
.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks
פרמטרים של נתיב
parent
string
חובה. השם של Document
שבו ייצור Chunk
. דוגמה: corpora/my-corpus-123/documents/the-doc-abc
התבנית היא corpora/{corpora}/documents/{document}
.
גוף הבקשה
גוף הבקשה מכיל מופע של Chunk
.
name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Chunk
. המזהה (השם ללא הקידומת corpora/*/documents/*/chunks/) יכול להכיל עד 40 תווים אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייווצר מזהה ייחודי אקראי בן 12 תווים. לדוגמה: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
data
object (ChunkData
)
חובה. התוכן של התג Chunk
, כמו מחרוזת הטקסט. מספר האסימונים המקסימלי בכל נתח הוא 2,043.
customMetadata[]
object (CustomMetadata
)
אופציונלי. מטא-נתונים בהתאמה אישית שהמשתמשים סיפקו, מאוחסנים כצמדי מפתח/ערך. המספר המקסימלי של CustomMetadata
בכל מקטע הוא 20.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע חדש של Chunk
.
שיטה: corpora.documents.chunks.list
מציג רשימה של כל Chunk
בDocument
.
נקודת קצה
gethttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks
פרמטרים של נתיב
parent
string
חובה. שם הDocument
שמכיל את Chunk
. דוגמה: corpora/my-corpus-123/documents/the-doc-abc
התבנית היא corpora/{corpora}/documents/{document}
.
פרמטרים של שאילתה
pageSize
integer
אופציונלי. המספר המקסימלי של Chunk
שיוחזרו (לכל דף). יכול להיות שהשירות יחזיר פחות מ-Chunk
.
אם לא מציינים ערך, יוחזרו לכל היותר 10 Chunk
. המגבלה המקסימלית היא 100 Chunk
בכל דף.
pageToken
string
אופציונלי. טוקן של דף שהתקבל מקריאה קודמת של chunks.list
.
כדי לאחזר את הדף הבא, צריך להזין את nextPageToken
שמוחזר בתגובה כארגומנט לבקשה הבאה.
כשמבצעים חלוקה לעמודים, כל הפרמטרים האחרים שסופקו ל-chunks.list
חייבים להיות זהים לקריאה שסיפקה את הטוקן של הדף.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
תשובה מ-chunks.list
שמכילה רשימה עם מספור עמודים של Chunk
. העמודה Chunk
ממוינת לפי chunk.create_time
בסדר עולה.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
chunks[]
object (Chunk
)
הערכים Chunk
שהוחזרו.
nextPageToken
string
טוקן שאפשר לשלוח כ-pageToken
כדי לאחזר את הדף הבא. אם משמיטים את השדה הזה, לא יופיעו דפים נוספים.
ייצוג ב-JSON |
---|
{
"chunks": [
{
object ( |
שיטה: corpora.documents.chunks.get
קבלת מידע על Chunk
ספציפי.
נקודת קצה
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /* /documents /* /chunks /*}
פרמטרים של נתיב
name
string
חובה. השם של Chunk
שרוצים לאחזר. דוגמה: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
התבנית היא corpora/{corpora}/documents/{document}/chunks/{chunk}
.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Chunk
.
שיטה: corpora.documents.chunks.patch
מעדכן את Chunk
.
נקודת קצה
patchhttps: / /generativelanguage.googleapis.com /v1beta /{chunk.name=corpora /* /documents /* /chunks /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{chunk.name=corpora/*/documents/*/chunks/*}
פרמטרים של נתיב
chunk.name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Chunk
. המזהה (השם ללא הקידומת corpora/*/documents/*/chunks/) יכול להכיל עד 40 תווים אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייווצר מזהה ייחודי אקראי בן 12 תווים. דוגמה: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
התבנית היא corpora/{corpora}/documents/{document}/chunks/{chunk}
.
פרמטרים של שאילתה
updateMask
string (FieldMask
format)
חובה. רשימת השדות לעדכון. בשלב הזה, אפשר לעדכן רק את customMetadata
ואת data
.
זוהי רשימה של שמות שדות שמוגדרים במלואם, שמופרדים באמצעות פסיקים. דוגמה: "user.displayName,photo"
גוף הבקשה
גוף הבקשה מכיל מופע של Chunk
.
data
object (ChunkData
)
חובה. התוכן של התג Chunk
, כמו מחרוזת הטקסט. מספר האסימונים המקסימלי בכל נתח הוא 2,043.
customMetadata[]
object (CustomMetadata
)
אופציונלי. מטא-נתונים בהתאמה אישית שהמשתמשים סיפקו, מאוחסנים כצמדי מפתח/ערך. המספר המקסימלי של CustomMetadata
בכל מקטע הוא 20.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Chunk
.
שיטה: corpora.documents.chunks.delete
מחיקת Chunk
.
נקודת קצה
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /* /documents /* /chunks /*}
פרמטרים של נתיב
name
string
חובה. שם המשאב של Chunk
שרוצים למחוק. דוגמה: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
התבנית היא corpora/{corpora}/documents/{document}/chunks/{chunk}
.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה הוא אובייקט JSON ריק.
שיטה: corpora.documents.chunks.batchCreate
יצירת קבוצה של Chunk
קודים.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchCreate
פרמטרים של נתיב
parent
string
אופציונלי. השם של Document
שבו ייווצר האצווה הזו של Chunk
. השדה ברמת ההורה בכל תג CreateChunkRequest
חייב להיות זהה לערך הזה. דוגמה: corpora/my-corpus-123/documents/the-doc-abc
התבנית היא corpora/{corpora}/documents/{document}
.
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
requests[]
object (CreateChunkRequest
)
חובה. הודעות הבקשה שמציינות את Chunk
שצריך ליצור. אפשר ליצור עד 100 Chunk
s באצווה.
גוף התשובה
תשובה מ-chunks.batchCreate
שמכילה רשימה של Chunk
שנוצרו.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
chunks[]
object (Chunk
)
נוצרו Chunk
.
ייצוג ב-JSON |
---|
{
"chunks": [
{
object ( |
CreateChunkRequest
שיטה: corpora.documents.chunks.batchUpdate
עדכון של כמה Chunk
בבת אחת.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchUpdate
פרמטרים של נתיב
parent
string
אופציונלי. השם של Document
שמכיל את Chunk
s שרוצים לעדכן. השדה ברמת ההורה בכל תג UpdateChunkRequest
חייב להיות זהה לערך הזה. דוגמה: corpora/my-corpus-123/documents/the-doc-abc
התבנית היא corpora/{corpora}/documents/{document}
.
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
requests[]
object (UpdateChunkRequest
)
חובה. הודעות הבקשה שמציינות את Chunk
שצריך לעדכן. אפשר לעדכן עד 100 Chunk
s בבת אחת.
גוף התשובה
תגובה מ-chunks.batchUpdate
שמכילה רשימה של Chunk
מעודכנים.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
chunks[]
object (Chunk
)
הפרטים של Chunk
עודכנו.
ייצוג ב-JSON |
---|
{
"chunks": [
{
object ( |
UpdateChunkRequest
בקשה לעדכן את Chunk
.
chunk
object (Chunk
)
חובה. הגרסה של Chunk
שצריך לעדכן.
updateMask
string (FieldMask
format)
חובה. רשימת השדות לעדכון. בשלב הזה, אפשר לעדכן רק את customMetadata
ואת data
.
זוהי רשימה של שמות שדות שמוגדרים במלואם, שמופרדים באמצעות פסיקים. דוגמה: "user.displayName,photo"
ייצוג ב-JSON |
---|
{
"chunk": {
object ( |
שיטה: corpora.documents.chunks.batchDelete
מחיקת Chunk
s בכמות גדולה.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /{parent=corpora /* /documents /*} /chunks:batchDelete
פרמטרים של נתיב
parent
string
אופציונלי. שם Document
שמכיל את Chunk
s שרוצים למחוק. השדה ברמת ההורה בכל תג DeleteChunkRequest
חייב להיות זהה לערך הזה. דוגמה: corpora/my-corpus-123/documents/the-doc-abc
התבנית היא corpora/{corpora}/documents/{document}
.
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
requests[]
object (DeleteChunkRequest
)
חובה. ההודעות עם הבקשה שמציינות את Chunk
שרוצים למחוק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה הוא אובייקט JSON ריק.
DeleteChunkRequest
בקשה למחיקה של Chunk
.
name
string
חובה. שם המשאב של Chunk
שרוצים למחוק. לדוגמה: corpora/my-corpus-123/documents/the-doc-abc/chunks/some-chunk
ייצוג ב-JSON |
---|
{ "name": string } |
משאב REST: corpora.documents.chunks
משאב: Chunk
Chunk
הוא חלק משני של Document
שמתייחסים אליו כיחידה עצמאית לצורך ייצוג וקטורי ואחסון. ב-Corpus
יכולים להיות עד מיליון Chunk
.
name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Chunk
. המזהה (השם ללא הקידומת corpora/*/documents/*/chunks/) יכול להכיל עד 40 תווים אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייווצר מזהה ייחודי אקראי בן 12 תווים. לדוגמה: corpora/{corpus_id}/documents/{document_id}/chunks/123a456b789c
data
object (ChunkData
)
חובה. התוכן של התג Chunk
, כמו מחרוזת הטקסט. מספר האסימונים המקסימלי בכל נתח הוא 2,043.
customMetadata[]
object (CustomMetadata
)
אופציונלי. מטא-נתונים בהתאמה אישית שהמשתמשים סיפקו, מאוחסנים כצמדי מפתח/ערך. המספר המקסימלי של CustomMetadata
בכל מקטע הוא 20.
createTime
string (Timestamp
format)
פלט בלבד. חותמת הזמן של מועד יצירת Chunk
.
הפלט שנוצר תמיד יהיה בפורמט RFC 3339, עם נורמליזציה של Z ושימוש ב-0, 3, 6 או 9 ספרות אחרי הנקודה. אפשר להשתמש גם בהיסטים אחרים מלבד Z. דוגמאות: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
או "2014-10-02T15:01:23+05:30"
.
updateTime
string (Timestamp
format)
פלט בלבד. חותמת הזמן של העדכון האחרון של Chunk
.
הפלט שנוצר תמיד יהיה בפורמט RFC 3339, עם נורמליזציה של Z ושימוש ב-0, 3, 6 או 9 ספרות אחרי הנקודה. אפשר להשתמש גם בהיסטים אחרים מלבד Z. דוגמאות: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
או "2014-10-02T15:01:23+05:30"
.
state
enum (State
)
פלט בלבד. המצב הנוכחי של Chunk
.
ייצוג ב-JSON |
---|
{ "name": string, "data": { object ( |
ChunkData
נתונים שחולצו ומייצגים את התוכן Chunk
.
data
Union type
data
יכול להיות רק אחד מהבאים:stringValue
string
התוכן של Chunk
כמחרוזת. מספר האסימונים המקסימלי בכל נתח הוא 2,043.
ייצוג ב-JSON |
---|
{ // data "stringValue": string // Union type } |
מדינה
מצבים במחזור החיים של Chunk
.
טיפוסים בני מנייה (enum) | |
---|---|
STATE_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה משמש אם לא מציינים את המצב. |
STATE_PENDING_PROCESSING |
Chunk נמצא בתהליך עיבוד (הטמעה ואחסון וקטורים). |
STATE_ACTIVE |
הנתונים של Chunk מעובדים וזמינים לשליפת מידע. |
STATE_FAILED |
Chunk העיבוד נכשל. |