שיטה: corpora.create
יוצרת Corpus
ריקה.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /corpora
גוף הבקשה
גוף הבקשה מכיל מופע של Corpus
.
name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Corpus
. המזהה (השם ללא הקידומת corpora/) יכול להכיל עד 40 תווים שהם אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייגזר שם ייחודי מ-displayName
יחד עם סיומת אקראית של 12 תווים. דוגמה: corpora/my-awesome-corpora-123a456b789c
displayName
string
אופציונלי. השם המוצג של Corpus
שקריא לבני אדם. אורך השם המוצג מוגבל ל-512 תווים, כולל רווחים. דוגמה: 'Docs on Semantic Retriever'
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע חדש של Corpus
.
שיטה: corpora.query
מבצע חיפוש סמנטי ב-Corpus
.
נקודת קצה
posthttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /*}:query
פרמטרים של נתיב
name
string
חובה. השם של Corpus
שאליו מתייחסת השאילתה. דוגמה: corpora/my-corpus-123
התבנית היא corpora/{corpora}
.
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
query
string
חובה. מחרוזת שאילתה לביצוע חיפוש סמנטי.
metadataFilters[]
object (MetadataFilter
)
אופציונלי. סינון של המטא-נתונים Chunk
ו-Document
. כל אובייקט MetadataFilter
צריך להתאים למפתח ייחודי. אובייקטים מרובים של MetadataFilter
מצורפים באמצעות לוגיקת AND.
שאילתה לדוגמה ברמת המסמך: (year >= 2020 OR year < 2010) AND (genre = drama OR genre = action)
MetadataFilter
רשימת אובייקטים: metadataFilters = [ {key = "document.custom_metadata.year" conditions = [{int_value = 2020, operation = GREATER_EQUAL}, {int_value = 2010, operation = LESS}]}, {key = "document.custom_metadata.year" conditions = [{int_value = 2020, operation = GREATER_EQUAL}, {int_value = 2010, operation = LESS}]}, {key = "document.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}]}]
שאילתה לדוגמה ברמת הצ'אנק לטווח מספרי של ערכים: (year > 2015 AND year <= 2020)
MetadataFilter
object list: metadataFilters = [ {key = "chunk.custom_metadata.year" conditions = [{int_value = 2015, operation = GREATER}]}, {key = "chunk.custom_metadata.year" conditions = [{int_value = 2020, operation = LESS_EQUAL}]}]
הערה: אפשר להשתמש ב-AND לאותו מפתח רק עם ערכים מספריים. ערכי מחרוזת תומכים רק ב-OR לאותו מפתח.
resultsCount
integer
אופציונלי. המספר המקסימלי של Chunk
שיש להחזיר. יכול להיות שהשירות יחזיר פחות מ-Chunk
.
אם לא מציינים ערך, יוחזרו לכל היותר 10 Chunk
. המספר המקסימלי של התוצאות שניתן לציין הוא 100.
גוף התשובה
תשובה מ-corpora.query
שמכילה רשימה של נתחים רלוונטיים.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
relevantChunks[]
object (RelevantChunk
)
החלקים הרלוונטיים.
ייצוג ב-JSON |
---|
{
"relevantChunks": [
{
object ( |
שיטה: corpora.list
רשימה של כל Corpora
שבבעלות המשתמש.
נקודת קצה
gethttps: / /generativelanguage.googleapis.com /v1beta /corpora
פרמטרים של שאילתה
pageSize
integer
אופציונלי. המספר המקסימלי של Corpora
שיוחזרו (לכל דף). יכול להיות שהשירות יחזיר פחות מ-Corpora
.
אם לא מציינים ערך, יוחזרו לכל היותר 10 Corpora
. המגבלה המקסימלית היא 20 Corpora
לכל דף.
pageToken
string
אופציונלי. טוקן של דף שהתקבל מקריאה קודמת של corpora.list
.
כדי לאחזר את הדף הבא, צריך להזין את nextPageToken
שמוחזר בתגובה כארגומנט לבקשה הבאה.
כשמבצעים חלוקה לעמודים, כל הפרמטרים האחרים שסופקו ל-corpora.list
חייבים להיות זהים לקריאה שסיפקה את הטוקן של הדף.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
תשובה מ-corpora.list
שמכילה רשימה עם מספור עמודים של Corpora
. התוצאות ממוינות לפי סדר עולה של corpus.create_time
.
אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:
corpora[]
object (Corpus
)
מקורות המידע שהוחזרו.
nextPageToken
string
טוקן שאפשר לשלוח כ-pageToken
כדי לאחזר את הדף הבא. אם משמיטים את השדה הזה, לא יופיעו דפים נוספים.
ייצוג ב-JSON |
---|
{
"corpora": [
{
object ( |
שיטה: corpora.get
קבלת מידע על Corpus
ספציפי.
נקודת קצה
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /*}
פרמטרים של נתיב
name
string
חובה. השם של Corpus
. דוגמה: corpora/my-corpus-123
התבנית היא corpora/{corpora}
.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Corpus
.
שיטה: corpora.patch
מעדכן את Corpus
.
נקודת קצה
patchhttps: / /generativelanguage.googleapis.com /v1beta /{corpus.name=corpora /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{corpus.name=corpora/*}
פרמטרים של נתיב
corpus.name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Corpus
. המזהה (השם ללא הקידומת corpora/) יכול להכיל עד 40 תווים שהם אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייגזר שם ייחודי מ-displayName
יחד עם סיומת אקראית של 12 תווים. דוגמה: corpora/my-awesome-corpora-123a456b789c
התבנית היא corpora/{corpora}
.
פרמטרים של שאילתה
updateMask
string (FieldMask
format)
חובה. רשימת השדות לעדכון. בשלב הזה, יש תמיכה רק בעדכון של displayName
.
זוהי רשימה של שמות שדות שמוגדרים במלואם, שמופרדים באמצעות פסיקים. דוגמה: "user.displayName,photo"
גוף הבקשה
גוף הבקשה מכיל מופע של Corpus
.
displayName
string
אופציונלי. השם המוצג של Corpus
שקריא לבני אדם. אורך השם המוצג מוגבל ל-512 תווים, כולל רווחים. דוגמה: 'Docs on Semantic Retriever'
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Corpus
.
שיטה: corpora.delete
מחיקת Corpus
.
נקודת קצה
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=corpora /*}
פרמטרים של נתיב
name
string
חובה. שם המשאב של Corpus
. דוגמה: corpora/my-corpus-123
התבנית היא corpora/{corpora}
.
פרמטרים של שאילתה
force
boolean
אופציונלי. אם הערך מוגדר כ-true, גם כל הDocument
והאובייקטים שקשורים לCorpus
הזה יימחקו.
אם הערך הוא False (ברירת המחדל), תוחזר שגיאת FAILED_PRECONDITION
אם Corpus
מכיל ערכים מסוג Document
.
גוף הבקשה
גוף הבקשה צריך להיות ריק.
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה הוא אובייקט JSON ריק.
משאב REST: corpora.permissions
משאב: הרשאה
משאב ההרשאה מעניק למשתמש, לקבוצה או לכל שאר העולם גישה למשאב PaLM API (למשל, מודל מכוונן, קורפוס).
תפקיד הוא אוסף של פעולות מותרות שמאפשרות למשתמשים לבצע פעולות ספציפיות במשאבים של PaLM API. כדי להפוך אותן לזמינות למשתמשים, לקבוצות או לחשבונות שירות, צריך להקצות תפקידים. כשמקצים תפקיד, מעניקים את ההרשאות שהתפקיד כולל.
יש שלושה תפקידים קונצנטריים. כל תפקיד הוא קבוצת-על של הפעולות המותרות בתפקיד הקודם:
- המשתמש עם הרשאת קריאה יכול להשתמש במשאב (למשל, מודל שעבר כוונון, קורפוס) להסקת מסקנות
- למשתמש עם הרשאת כתיבה יש הרשאות קריאה, והוא יכול גם לערוך ולשתף
- לבעלים יש הרשאות כתיבה, והם יכולים גם למחוק
name
string
פלט בלבד. מזהה. שם ההרשאה. שם ייחודי ייווצר בזמן היצירה. דוגמאות: tunedModels/{tunedModel}/permissions/{permission} corpora/{corpus}/permissions/{permission} פלט בלבד.
granteeType
enum (GranteeType
)
אופציונלי. אי אפשר לשנות אותו. סוג מקבל ההרשאה.
emailAddress
string
אופציונלי. אי אפשר לשנות אותו. כתובת האימייל של המשתמש או הקבוצה שאליהם מתייחסת ההרשאה. השדה לא מוגדר כשסוג מקבל ההרשאה הוא EVERYONE.
role
enum (Role
)
חובה. התפקיד שמוענק על ידי ההרשאה הזו.
ייצוג ב-JSON |
---|
{ "name": string, "granteeType": enum ( |
GranteeType
הגדרת סוגי המקבלים של ההרשאה הזו.
טיפוסים בני מנייה (enum) | |
---|---|
GRANTEE_TYPE_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה לא בשימוש. |
USER |
מייצג משתמש. אם מגדירים את המאפיין הזה, צריך לציין את כתובת האימייל של המשתמש. |
GROUP |
מייצג קבוצה. אם מגדירים את המאפיין הזה, צריך לציין את כתובת האימייל של הקבוצה. |
EVERYONE |
מייצג גישה לכולם. לא נדרש מידע נוסף. |
תפקיד
מגדיר את התפקיד שמוענק על ידי ההרשאה הזו.
טיפוסים בני מנייה (enum) | |
---|---|
ROLE_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה לא בשימוש. |
OWNER |
הבעלים יכול להשתמש במשאב, לעדכן אותו, לשתף אותו ולמחוק אותו. |
WRITER |
הכותב יכול להשתמש במשאב, לעדכן אותו ולשתף אותו. |
READER |
למשתמש יש הרשאת קריאה במשאב. |
MetadataFilter
מסנן שסופק על ידי המשתמש כדי להגביל את האחזור על סמך ערכי מטא-נתונים ברמה Chunk
או Document
. דוגמה (genre = drama OR genre = action): key = "document.custom_metadata.genre" conditions = [{stringValue = "drama", operation = EQUAL}, {stringValue = "action", operation = EQUAL}]
key
string
חובה. המפתח של המטא-נתונים שלפיו רוצים לסנן.
conditions[]
object (Condition
)
חובה. ה-Condition
s של המפתח הנתון שיפעילו את המסנן הזה. כמה תנאים מחוברים באמצעות אופרטורים לוגיים של OR.Condition
ייצוג ב-JSON |
---|
{
"key": string,
"conditions": [
{
object ( |
תנאי
תנאי סינון שחל על מקש יחיד.
operation
enum (Operator
)
חובה. אופרטור שמוחל על צמד המפתח/ערך הנתון כדי להפעיל את התנאי.
value
Union type
CustomMetadata
יש סוג ערך StringList
, תנאי הסינון צריך להשתמש ב-string_value
בשילוב עם פעולת INCLUDES או EXCLUDES, אחרת התוצאה תהיה גם היא קבוצה ריקה. הערך value
יכול להיות רק אחד מהבאים:stringValue
string
ערך המחרוזת שלפיו יתבצע הסינון של המטא-נתונים.
numericValue
number
הערך המספרי שלפיו רוצים לסנן את המטא-נתונים.
ייצוג ב-JSON |
---|
{
"operation": enum ( |
מפעיל
מגדירה את האופרטורים התקפים שאפשר להחיל על צמד מפתח/ערך.
טיפוסים בני מנייה (enum) | |
---|---|
OPERATOR_UNSPECIFIED |
ערך ברירת המחדל. הערך הזה לא בשימוש. |
LESS |
נתמך על ידי numeric. |
LESS_EQUAL |
נתמך על ידי numeric. |
EQUAL |
נתמך על ידי ערכים מספריים ומחרוזות. |
GREATER_EQUAL |
נתמך על ידי numeric. |
GREATER |
נתמך על ידי numeric. |
NOT_EQUAL |
נתמך על ידי ערכים מספריים ומחרוזות. |
INCLUDES |
הפונקציה נתמכת על ידי מחרוזת רק אם סוג הערך CustomMetadata של המפתח הנתון הוא stringListValue . |
EXCLUDES |
הפונקציה נתמכת על ידי מחרוזת רק אם סוג הערך CustomMetadata של המפתח הנתון הוא stringListValue . |
משאב REST: corpora
משאב: מאגר
Corpus
הוא אוסף של Document
. בכל פרויקט אפשר ליצור עד 5 מאגרי מידע.
name
string
אי אפשר לשנות אותו. מזהה. שם המשאב Corpus
. המזהה (השם ללא הקידומת corpora/) יכול להכיל עד 40 תווים שהם אלפאנומריים באותיות קטנות או מקפים (-). המזהה לא יכול להתחיל או להסתיים במקף. אם השם ריק בזמן היצירה, ייגזר שם ייחודי מ-displayName
יחד עם סיומת אקראית של 12 תווים. דוגמה: corpora/my-awesome-corpora-123a456b789c
displayName
string
אופציונלי. השם המוצג של Corpus
שקריא לבני אדם. אורך השם המוצג מוגבל ל-512 תווים, כולל רווחים. דוגמה: 'Docs on Semantic Retriever'
createTime
string (Timestamp
format)
פלט בלבד. חותמת הזמן של מועד יצירת Corpus
.
הפלט שנוצר תמיד יהיה בפורמט RFC 3339, עם נורמליזציה של Z ושימוש ב-0, 3, 6 או 9 ספרות אחרי הנקודה. אפשר להשתמש גם בהיסטים אחרים מלבד Z. דוגמאות: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
או "2014-10-02T15:01:23+05:30"
.
updateTime
string (Timestamp
format)
פלט בלבד. חותמת הזמן של העדכון האחרון של Corpus
.
הפלט שנוצר תמיד יהיה בפורמט RFC 3339, עם נורמליזציה של Z ושימוש ב-0, 3, 6 או 9 ספרות אחרי הנקודה. אפשר להשתמש גם בהיסטים אחרים מלבד Z. דוגמאות: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
או "2014-10-02T15:01:23+05:30"
.
ייצוג ב-JSON |
---|
{ "name": string, "displayName": string, "createTime": string, "updateTime": string } |