שיטה: corpora.create
הפונקציה יוצרת Corpus
ריק.
נקודת קצה
פרסום https://generativelanguage.googleapis.com/v1beta/corporaגוף הבקשה
גוף הבקשה מכיל מופע של Corpus
.
name
string
קבוע. מזהה. שם המשאב Corpus
. המזהה (השם, לא כולל הקידומת 'corpora/') יכול להכיל עד 40 תווים אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, המערכת תיצור שם ייחודי מ-displayName
עם סיומת אקראית באורך 12 תווים. לדוגמה: corpora/my-awesome-corpora-123a456b789c
displayName
string
זה שינוי אופציונלי. שם תצוגה קריא לאנשים של Corpus
. אורך השם לתצוגה חייב להיות עד 512 תווים, כולל רווחים. דוגמה: "Docs on Semantic Retriever"
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע חדש של Corpus
.
שיטה: corpora.query
מבצע חיפוש סמנטי בCorpus
.
נקודת קצה
פרסום https://generativelanguage.googleapis.com/v1beta/{name=corpora/*}:queryפרמטרים של נתיב
name
string
חובה. השם של Corpus
שרוצים לשלוח אליו שאילתה. דוגמה: corpora/my-corpus-123
הוא בפורמט corpora/{corpora}
.
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
query
string
חובה. מחרוזת שאילתה לביצוע חיפוש סמנטי.
metadataFilters[]
object (MetadataFilter
)
זה שינוי אופציונלי. סינון לפי מטא-נתונים של Chunk
ו-Document
. כל אובייקט MetadataFilter
צריך להתאים למפתח ייחודי. אובייקטים מרובים של MetadataFilter
מצורפים באמצעות 'AND' לוגית.
שאילתה לדוגמה ברמת המסמך: (year >= 2020 OR year < 2010) AND (genre = drama OR genre = action)
MetadataFilter
object list: metadataFilters = [ {key = "document.custom_metadata.year" תנאים = [{int_value = 2020, Action = GREATER_EQUAL}, {int_value = 2010, Action = LESS}]}, {key = "document.custom_metadata.year" תנאים = [{int_value = 2020, Action = GREATER_EQUAL}, {int_value = 2010, action = LESS}]}, {key = "document.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}]}]
שאילתה לדוגמה ברמת מקטע עבור טווח מספרי של ערכים: (שנה > 2015 AND שנה <= 2020)
רשימת אובייקטים של MetadataFilter
: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2015, operation = GREATER}]}, {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = LESS_EQUAL}]}]
הערה: יש תמיכה ב-AND לאותו מפתח רק עבור ערכים מספריים. ערכי מחרוזת תומכים רק בסימן 'OR' (או) עבור אותו מפתח.
resultsCount
integer
זה שינוי אופציונלי. המספר המקסימלי של Chunk
s שיוחזר. השירות עשוי להחזיר פחות Chunk
שניות.
אם לא צוין ערך, יוחזרו עד 10 ערכים של Chunk
. המספר המקסימלי של תוצאות שאפשר לציין הוא 100.
גוף התשובה
התשובה מאת corpora.query
, שמכילה רשימה של מקטעי נתונים רלוונטיים.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
relevantChunks[]
object (RelevantChunk
)
הקטעים הרלוונטיים.
ייצוג ב-JSON |
---|
{
"relevantChunks": [
{
object ( |
שיטה: corpora.list
בתיבת הדו-שיח הזו מפורטים כל Corpora
שבבעלות המשתמש.
נקודת קצה
הורדה https://generativelanguage.googleapis.com/v1beta/corporaפרמטרים של שאילתה
pageSize
integer
זה שינוי אופציונלי. המספר המקסימלי של Corpora
להחזרה (לכל דף). השירות עשוי להחזיר פחות Corpora
.
אם לא צוין, יוחזרו לכל היותר 10 Corpora
. מגבלת הגודל המקסימלית היא 20 Corpora
לכל דף.
pageToken
string
זה שינוי אופציונלי. אסימון דף, שהתקבל מקריאה קודמת ב-corpora.list
.
צריך לספק את ה-nextPageToken
שהוחזר בתשובה כארגומנט לבקשה הבאה כדי לאחזר את הדף הבא.
כשמחלקים את הדפים, כל הפרמטרים האחרים שסופקו ל-corpora.list
חייבים להתאים לקריאה שסיפקה את אסימון הדף.
גוף הבקשה
גוף הבקשה חייב להיות ריק.
גוף התשובה
תגובה מ-corpora.list
שמכילה רשימה מחולקת לדפים של Corpora
. התוצאות ממוינות לפי corpus.create_time
עולה.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
corpora[]
object (Corpus
)
מאגרי הנתונים שהוחזרו.
nextPageToken
string
אסימון שאפשר לשלוח כ-pageToken
כדי לאחזר את הדף הבא. אם השדה הזה לא יצוין, לא יהיו דפים נוספים.
ייצוג ב-JSON |
---|
{
"corpora": [
{
object ( |
שיטה: corpora.get
קבלת מידע על Corpus
ספציפי.
נקודת קצה
get https://generativelanguage.googleapis.com/v1beta/{name=corpora/*}פרמטרים של נתיב
name
string
חובה. השם של Corpus
. דוגמה: corpora/my-corpus-123
הוא בפורמט corpora/{corpora}
.
גוף הבקשה
גוף הבקשה חייב להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכלול מופע של Corpus
.
שיטה: corpora.patch
מתבצע עדכון של Corpus
.
נקודת קצה
תיקון https://generativelanguage.googleapis.com/v1beta/{corpus.name=corpora/*}PATCH https://generativelanguage.googleapis.com/v1beta/{corpus.name=corpora/*}
פרמטרים של נתיב
corpus.name
string
קבוע. מזהה. שם המשאב Corpus
. המזהה (שם לא כולל התחילית 'corpora/ ') יכול להכיל עד 40 תווים אלפאנומריים או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם יהיה ריק בזמן היצירה, המערכת תיצור שם ייחודי מ-displayName
יחד עם סיומת אקראית בת 12 תווים. לדוגמה: corpora/my-awesome-corpora-123a456b789c
היא מופיעה בצורה corpora/{corpora}
.
פרמטרים של שאילתה
updateMask
string (FieldMask
format)
חובה. רשימת השדות שרוצים לעדכן. נכון לעכשיו, הגרסה הזו תומכת רק בעדכון של displayName
.
זוהי רשימה של שמות שדות מוגדרים במלואם, שמופרדים בפסיקים. דוגמה: "user.displayName,photo"
גוף הבקשה
גוף הבקשה מכיל מופע של Corpus
.
displayName
string
זה שינוי אופציונלי. השם המוצג של ה-Corpus
, שקריא לבני אדם. השם המוצג יכול להיות באורך של 512 תווים לכל היותר, כולל רווחים. דוגמה: "Docs on Semantic Retriever"
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכלול מופע של Corpus
.
שיטה: corpora.delete
מתבצעת מחיקה של Corpus
.
נקודת קצה
מחיקת https://generativelanguage.googleapis.com/v1beta/{name=corpora/*}פרמטרים של נתיב
name
string
חובה. שם המשאב של ה-Corpus
. דוגמה: corpora/my-corpus-123
הוא בפורמט corpora/{corpora}
.
פרמטרים של שאילתה
force
boolean
זה שינוי אופציונלי. אם המדיניות מוגדרת כ-True, כל הפריטים מסוג 'Document
' ו'אובייקטים' שקשורים ל-Corpus
הזה יימחקו גם הם.
אם הערך הוא False (ברירת המחדל), תוחזר שגיאת FAILED_PRECONDITION
אם הערך של Corpus
מכיל ערכים מסוג Document
.
גוף הבקשה
גוף הבקשה חייב להיות ריק.
גוף התשובה
אם הביצוע יהיה תקין, גוף התגובה יהיה ריק.
משאב REST: corpora.permissions
משאב: הרשאה
משאב ההרשאה מעניק למשתמש, לקבוצה או לשאר העולם גישה למשאב של PaLM API (למשל, מודל מכוונן, קורפוס).
תפקיד הוא אוסף של פעולות מותרות שמאפשרות למשתמשים לבצע פעולות ספציפיות במשאבי PaLM API. כדי שיהיו זמינים למשתמשים, לקבוצות או לחשבונות שירות, צריך להקצות תפקידים. כשאתם מקצים תפקיד, אתם מעניקים לו את ההרשאות שהתפקיד כולל.
יש שלושה תפקידים קונצנטריים. כל תפקיד הוא קבוצת-על של הפעולות המותרות של התפקיד הקודם:
- הקורא יכול להשתמש במשאב (למשל מודל מותאם, קורפוס) להסקה
- לכותב יש הרשאות של קורא, וגם אפשרות לערוך ולשתף
- לבעלים יש הרשאות כתיבה וגם למחוק
name
string
פלט בלבד. מזהה. שם ההרשאה. שם ייחודי ייווצר בזמן היצירה. דוגמאות: AdjustModels/{tunedModel}/permissions/{permission} corpora/{corpus}/permissions/{permission} פלט בלבד.
granteeType
enum (GranteeType
)
זה שינוי אופציונלי. בלתי ניתן לשינוי. הסוג של מקבל המענק.
emailAddress
string
זה שינוי אופציונלי. קבוע. כתובת האימייל של משתמש הקבוצה שאליה ההרשאה הזו מתייחסת. השדה לא מוגדר כשסוג המקבל של ההרשאה הוא 'הכול'.
role
enum (Role
)
חובה. התפקיד שההרשאה הזו מעניקה.
ייצוג ב-JSON |
---|
{ "name": string, "granteeType": enum ( |
GranteeType
הגדרת הסוגים של מקבל ההרשאה הזו.
טיפוסים בני מנייה (enum) | |
---|---|
GRANTEE_TYPE_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה לא בשימוש. |
USER |
מייצג משתמש. כשמגדירים את השדה, צריך לציין את כתובת האימייל של המשתמש. |
GROUP |
מייצג קבוצה. כשמגדירים את השדה, צריך לציין את כתובת האימייל של הקבוצה. |
EVERYONE |
מייצג גישה לכולם. אין צורך במידע נוסף. |
תפקיד
מגדיר את התפקיד שההרשאה הזו מעניקה.
טיפוסים בני מנייה (enum) | |
---|---|
ROLE_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה לא בשימוש. |
OWNER |
הבעלים יכול להשתמש במשאב, לעדכן אותו, לשתף אותו ולמחוק אותו. |
WRITER |
הכותבים יכולים להשתמש במשאב, לעדכן אותו ולשתף אותו. |
READER |
הקוראים יכולים להשתמש במשאב. |
MetadataFilter
מסנן שהמשתמש סיפק כדי להגביל את אחזור הנתונים על סמך ערכי מטא-נתונים ברמה Chunk
או Document
. דוגמה (ז'אנר = דרמה או ז'אנר = פעולה): key = "document.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}]
key
string
חובה. המפתח של המטא-נתונים שלפיו רוצים לסנן.
conditions[]
object (Condition
)
חובה. ערכי Condition
של המפתח הנתון שיפעילו את המסנן הזה. כמה פונקציות Condition
מצורפות באמצעות אופרטורים לוגיים מסוג OR.
ייצוג JSON |
---|
{
"key": string,
"conditions": [
{
object ( |
תנאי
תנאי סינון שרלוונטי למפתח יחיד.
operation
enum (Operator
)
חובה. האופרטור הוחל על צמד המפתח/ערך הנתון כדי להפעיל את התנאי.
value
. סוג הערך חייב להיות תואם לסוג הערך שמוגדר בשדה של המפתח התואם. אם סוגי הערכים לא עקביים, התוצאה תהיה קבוצה ריקה. כשהערך של CustomMetadata
כולל ערך מסוג StringList
, תנאי הסינון צריך להשתמש ב-string_value
בשילוב עם פעולת הכללה/החרגה, אחרת התוצאה תהיה גם קבוצה ריקה. value
יכול להיות רק אחת מהאפשרויות הבאות:
stringValue
string
ערך המחרוזת שלפיו יש לסנן את המטא-נתונים.
numericValue
number
הערך המספרי שלפיו יתבצע סינון המטא-נתונים.
ייצוג ב-JSON |
---|
{ "operation": enum ( |
מפעיל
מגדירה את האופרטורים החוקיים שאפשר להחיל על צמד מפתח/ערך.
טיפוסים בני מנייה (enum) | |
---|---|
OPERATOR_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה לא בשימוש. |
LESS |
נתמך על ידי numeric. |
LESS_EQUAL |
נתמך על ידי numeric. |
EQUAL |
נתמך באמצעות מספרי & String. |
GREATER_EQUAL |
נתמך על ידי numeric. |
GREATER |
נתמך על ידי numeric. |
NOT_EQUAL |
יש תמיכה במספרים ובמחרוזות. |
INCLUDES |
נתמך באמצעות מחרוזת רק אם לסוג הערך CustomMetadata למפתח הנתון יש stringListValue . |
EXCLUDES |
נתמכת במחרוזת רק כאשר סוג הערך של CustomMetadata למפתח הנתון מכיל stringListValue . |
משאב REST: corpora
מקור מידע: Corpus
Corpus
הוא אוסף של Document
. אפשר ליצור עד 5 קורפוסים בפרויקט.
name
string
קבוע. מזהה. שם המשאב Corpus
. המזהה (השם, לא כולל הקידומת 'corpora/') יכול להכיל עד 40 תווים אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, המערכת תיצור שם ייחודי מ-displayName
עם סיומת אקראית באורך 12 תווים. דוגמה: corpora/my-awesome-corpora-123a456b789c
displayName
string
זה שינוי אופציונלי. השם המוצג של ה-Corpus
, שקריא לבני אדם. אורך השם לתצוגה חייב להיות עד 512 תווים, כולל רווחים. דוגמה: "Docs on Semantic Retriever"
createTime
string (Timestamp
format)
פלט בלבד. חותמת הזמן של מועד היצירה של Corpus
.
חותמת זמן ב-RFC3339 UTC 'Zulu' בפורמט של רזולוציה של ננו-שנייה ועד תשע ספרות עשרוניות. דוגמאות: "2014-10-02T15:01:23Z"
ו-"2014-10-02T15:01:23.045123456Z"
.
updateTime
string (Timestamp
format)
פלט בלבד. חותמת הזמן של מועד העדכון האחרון של Corpus
.
חותמת זמן בפורמט UTC 'Zulu' של RFC3339, עם רזולוציה של ננו-שנייה ועד תשע ספרות עשרוניות. דוגמאות: "2014-10-02T15:01:23Z"
ו-"2014-10-02T15:01:23.045123456Z"
.
ייצוג JSON |
---|
{ "name": string, "displayName": string, "createTime": string, "updateTime": string } |