ה-API של חיפוש קבצים מפנה לקובצי המקור הגולמיים או למסמכים שלכם כאובייקטים זמניים של קבצים.
שיטה: fileSearchStores.documents.delete
מחיקת Document.
נקודת קצה
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=fileSearchStores /* /documents /*}
פרמטרים של נתיב
name
string
חובה. שם המשאב של Document שרוצים למחוק. דוגמה: fileSearchStores/my-file-search-store-123/documents/the-doc-abc התוצאה תהיה fileSearchStores/{filesearchstore}/documents/{document}.
פרמטרים של שאילתה
force
boolean
אופציונלי. אם הערך מוגדר כ-true, גם כל ה-Chunk והאובייקטים שקשורים ל-Document הזה יימחקו.
אם הערך הוא False (ברירת המחדל), תוחזר שגיאת FAILED_PRECONDITION אם Document מכיל ערכים מסוג Chunk.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה הוא אובייקט JSON ריק.
שיטה: fileSearchStores.documents.get
קבלת מידע על Document ספציפי.
נקודת קצה
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=fileSearchStores /* /documents /*}
פרמטרים של נתיב
name
string
חובה. השם של Document שרוצים לאחזר. דוגמה: fileSearchStores/my-file-search-store-123/documents/the-doc-abc התוצאה תהיה fileSearchStores/{filesearchstore}/documents/{document}.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Document.
שיטה: fileSearchStores.documents.list
רשימה של כל Document בCorpus.
נקודת קצה
gethttps: / /generativelanguage.googleapis.com /v1beta /{parent=fileSearchStores /*} /documents
פרמטרים של נתיב
parent
string
חובה. השם של FileSearchStore שמכיל את Document. דוגמה: fileSearchStores/my-file-search-store-123 התוצאה תהיה fileSearchStores/{filesearchstore}.
פרמטרים של שאילתה
pageSize
integer
אופציונלי. המספר המקסימלי של Document שיוחזרו (לכל דף). יכול להיות שהשירות יחזיר פחות מ-Document.
אם לא מציינים ערך, יוחזרו לכל היותר 10 Document. המגבלה המקסימלית היא 20 Documents לכל דף.
pageToken
string
אופציונלי. טוקן של דף שהתקבל מקריאה קודמת של documents.list.
כדי לאחזר את הדף הבא, צריך להזין את nextPageToken שמוחזר בתגובה כארגומנט לבקשה הבאה.
כשמבצעים חלוקה לעמודים, כל הפרמטרים האחרים שסופקו ל-documents.list חייבים להיות זהים לקריאה שסיפקה את הטוקן של הדף.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
תשובה מ-documents.list שמכילה רשימה עם מספור עמודים של Document. העמודה Document ממוינת לפי document.create_time בסדר עולה.
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל נתונים במבנה הבא:
documents[]
object (Document)
הערכים Document שהוחזרו.
nextPageToken
string
טוקן שאפשר לשלוח כ-pageToken כדי לאחזר את הדף הבא. אם משמיטים את השדה הזה, לא יופיעו דפים נוספים.
| ייצוג ב-JSON |
|---|
{
"documents": [
{
object ( |
שיטה: fileSearchStores.documents.query
מבצע חיפוש סמנטי ב-Document.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /{name=fileSearchStores /* /documents /*}:query
פרמטרים של נתיב
name
string
חובה. השם של Document שאותו רוצים לשאול. דוגמה: fileSearchStores/my-file-search-store-123/documents/the-doc-abc התוצאה תהיה fileSearchStores/{filesearchstore}/documents/{document}.
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
query
string
חובה. מחרוזת שאילתה לביצוע חיפוש סמנטי.
resultsCount
integer
אופציונלי. מספר המקסימלי של Chunk שיש להחזיר. יכול להיות שהשירות יחזיר פחות מ-Chunk.
אם לא מציינים ערך, יוחזרו לכל היותר 10 Chunk. המספר המקסימלי של התוצאות שניתן לציין הוא 100.
metadataFilters[]
object (MetadataFilter)
אופציונלי. סינון לפי מטא-נתונים של Chunk. כל אובייקט MetadataFilter צריך להתאים למפתח ייחודי. אובייקטים מרובים של MetadataFilter מצורפים באמצעות לוגיקת AND.
הערה: סינון ברמה Document לא נתמך בבקשה הזו כי כבר צוין שם של Document.
שאילתה לדוגמה: (year >= 2020 OR year < 2010) AND (genre = drama OR genre = action)
MetadataFilter object list: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = GREATER_EQUAL}, {int_value = 2010, operation = LESS}}, {key = "chunk.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}}]
שאילתה לדוגמה לטווח מספרי של ערכים: (year > 2015 AND year <= 2020)
MetadataFilter object list: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2015, operation = GREATER}]}, {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = LESS_EQUAL}]}]
הערה: אפשר להשתמש ב-AND לאותו מפתח רק עם ערכים מספריים. ערכי מחרוזת תומכים רק ב-OR לאותו מפתח.
גוף התשובה
תשובה מ-documents.query שמכילה רשימה של נתחים רלוונטיים.
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל נתונים במבנה הבא:
relevantChunks[]
object (RelevantChunk)
החלקים הרלוונטיים שמוחזרים.
| ייצוג ב-JSON |
|---|
{
"relevantChunks": [
{
object ( |
משאב REST: fileSearchStores.documents
משאב: מסמך
Document הוא אוסף של Chunk.
name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Document. המזהה (השם ללא הקידומת fileSearchStores/*/documents/) יכול להכיל עד 40 תווים שהם אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייגזר שם ייחודי מ-displayName יחד עם סיומת אקראית של 12 תווים. דוגמה: fileSearchStores/{file_search_store_id}/documents/my-awesome-doc-123a456b789c
displayName
string
אופציונלי. השם המוצג של Document שקריא לבני אדם. אורך השם המוצג מוגבל ל-512 תווים, כולל רווחים. דוגמה: "Semantic Retriever Documentation"
customMetadata[]
object (CustomMetadata)
אופציונלי. מטא-נתונים בהתאמה אישית שהמשתמשים סיפקו, שנשמרים כצמדי מפתח/ערך ומשמשים לשליחת שאילתות. Document יכול להכיל עד 20 CustomMetadata.
updateTime
string (Timestamp format)
פלט בלבד. חותמת הזמן של העדכון האחרון של Document.
הפלט שנוצר תמיד יהיה בפורמט RFC 3339, עם נורמליזציה של Z ושימוש ב-0, 3, 6 או 9 ספרות אחרי הנקודה. אפשר להשתמש גם בהיסטים אחרים מלבד Z. דוגמאות: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" או "2014-10-02T15:01:23+05:30".
createTime
string (Timestamp format)
פלט בלבד. חותמת הזמן של מועד יצירת Document.
הפלט שנוצר תמיד יהיה בפורמט RFC 3339, עם נורמליזציה של Z ושימוש ב-0, 3, 6 או 9 ספרות אחרי הנקודה. אפשר להשתמש גם בהיסטים אחרים מלבד Z. דוגמאות: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" או "2014-10-02T15:01:23+05:30".
state
enum (State)
פלט בלבד. המצב הנוכחי של Document.
sizeBytes
string (int64 format)
פלט בלבד. גודל הבייטים הגולמיים שנקלטו במסמך.
mimeType
string
פלט בלבד. סוג ה-MIME של המסמך.
| ייצוג ב-JSON |
|---|
{ "name": string, "displayName": string, "customMetadata": [ { object ( |
מדינה (State)
מצבים במחזור החיים של Document.
| טיפוסים בני מנייה (enum) | |
|---|---|
STATE_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה משמש אם לא מציינים את המצב. |
STATE_PENDING |
חלק מChunks של Document נמצאים בתהליך עיבוד (הטמעה ואחסון וקטורים). |
STATE_ACTIVE |
כל הנתונים Chunks של Document מעובדים וזמינים להרצת שאילתות. |
STATE_FAILED |
העיבוד של חלק מהChunks של Document נכשל. |