Gemini API की फ़ाइन ट्यूनिंग की सुविधा, इनपुट/आउटपुट के उदाहरणों का छोटा डेटासेट होने पर, आउटपुट को चुनने का तरीका उपलब्ध कराती है. ज़्यादा जानकारी के लिए, मॉडल ट्यूनिंग गाइड और ट्यूटोरियल देखें.
तरीका: tunedModels.create
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
ट्यून किया गया मॉडल बनाता है. google.longrunning.Operations
सेवा की मदद से, ट्यूनिंग की प्रोग्रेस देखें.
ऑपरेशंस सेवा की मदद से, स्टेटस और नतीजे ऐक्सेस करें. उदाहरण: GET /v1/tunedModels/az2mb0bpw6i/operations/000-111-222
एंडपॉइंट
पोस्टhttps: / /generativelanguage.googleapis.com /v1beta /tunedModels
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
क्वेरी पैरामीटर
tunedModelId
string
ज़रूरी नहीं. ट्यून किए गए मॉडल का यूनीक आईडी, अगर दिया गया हो. इस वैल्यू में ज़्यादा से ज़्यादा 40 वर्ण होने चाहिए. पहला वर्ण कोई अक्षर होना चाहिए और आखिरी वर्ण कोई अक्षर या संख्या हो सकती है. आईडी, रेगुलर एक्सप्रेशन से मेल खाना चाहिए: [a-z]([a-z0-9-]{0,38}[a-z0-9])?
.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में TunedModel
का उदाहरण है.
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखाया जाने वाला नाम. डिसप्ले नेम में स्पेस के साथ 40 से ज़्यादा वर्ण नहीं होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
tuningTask
object (TuningTask
)
ज़रूरी है. ट्यूनिंग टास्क, जो ट्यून किया गया मॉडल बनाता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model
इनमें से कोई एक हो सकता है:tunedModelSource
object (TunedModelSource
)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेनिंग देने के लिए शुरुआती पॉइंट के तौर पर किया जाता है.
baseModel
string
इम्यूटेबल. ट्यून करने के लिए Model
का नाम. उदाहरण: models/gemini-1.5-flash-001
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमिटी को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0]
से ज़्यादा हो सकती हैं. 1.0
के करीब की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0
के करीब की वैल्यू से, आम तौर पर मॉडल से कम चौंकाने वाले जवाब मिलेंगे.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
topP
number
ज़रूरी नहीं. Nucleus सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को शामिल किया जाता है, जिनकी संभावना का योग कम से कम topP
होता है.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे संभावित टोकन के सेट को ध्यान में रखा जाता है. इस वैल्यू से पता चलता है कि मॉडल को कॉल करते समय, बैकएंड किस डिफ़ॉल्ट वैल्यू का इस्तेमाल करेगा.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में Operation
का नया इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.generateContent
किसी इनपुट GenerateContentRequest
के आधार पर, मॉडल का जवाब जनरेट करता है. इस्तेमाल से जुड़ी ज़्यादा जानकारी के लिए, टेक्स्ट जनरेशन गाइड देखें. अलग-अलग मॉडल के लिए इनपुट की सुविधाएं अलग-अलग होती हैं. इनमें ट्यून किए गए मॉडल भी शामिल हैं. ज़्यादा जानकारी के लिए, मॉडल गाइड और ट्यूनिंग गाइड देखें.
एंडपॉइंट
पोस्टhttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:generateContent
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
पाथ पैरामीटर
model
string
ज़रूरी है. Model
का नाम, जिसका इस्तेमाल पूरा होने की जानकारी जनरेट करने के लिए किया जाएगा.
फ़ॉर्मैट: models/{model}
. यह tunedModels/{tunedmodel}
फ़ॉर्मैट में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में नीचे दिए गए स्ट्रक्चर वाला डेटा होता है:
tools[]
object (Tool
)
ज़रूरी नहीं. Tools
की सूची, जिसका इस्तेमाल Model
अगला रिस्पॉन्स जनरेट करने के लिए कर सकता है.
Tool
एक कोड है, जो सिस्टम को बाहरी सिस्टम के साथ इंटरैक्ट करने की सुविधा देता है. इससे सिस्टम, Model
के दायरे और जानकारी के बाहर कोई कार्रवाई या कार्रवाइयों का सेट कर सकता है. Tool
के तौर पर Function
और codeExecution
का इस्तेमाल किया जा सकता है. ज़्यादा जानने के लिए, फ़ंक्शन कॉल करने और कोड लागू करने से जुड़ी गाइड देखें.
toolConfig
object (ToolConfig
)
ज़रूरी नहीं. अनुरोध में बताए गए किसी भी Tool
के लिए टूल कॉन्फ़िगरेशन. इस्तेमाल के उदाहरण के लिए, फ़ंक्शन कॉल करने की गाइड देखें.
safetySettings[]
object (SafetySetting
)
ज़रूरी नहीं. असुरक्षित कॉन्टेंट को ब्लॉक करने के लिए, यूनीक SafetySetting
इंस्टेंस की सूची.
यह GenerateContentRequest.contents
और GenerateContentResponse.candidates
पर लागू होगा. हर SafetyCategory
टाइप के लिए, एक से ज़्यादा सेटिंग नहीं होनी चाहिए. एपीआई, उन सभी कॉन्टेंट और रिस्पॉन्स को ब्लॉक कर देगा जो इन सेटिंग में तय किए गए थ्रेशोल्ड को पूरा नहीं करते. यह सूची, safetySettings में बताए गए हर SafetyCategory
के लिए डिफ़ॉल्ट सेटिंग को बदल देती है. अगर सूची में दी गई किसी SafetyCategory
के लिए कोई SafetySetting
नहीं है, तो एपीआई उस कैटगरी के लिए सुरक्षा की डिफ़ॉल्ट सेटिंग का इस्तेमाल करेगा. नुकसान पहुंचाने वाली कैटगरी HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_CIVIC_INTEGRITY का इस्तेमाल किया जा सकता है. सुरक्षा से जुड़ी उपलब्ध सेटिंग के बारे में ज़्यादा जानकारी के लिए, गाइड देखें. अपने एआई ऐप्लिकेशन में सुरक्षा से जुड़ी बातों को शामिल करने का तरीका जानने के लिए, सुरक्षा से जुड़े दिशा-निर्देश भी देखें.
systemInstruction
object (Content
)
ज़रूरी नहीं. डेवलपर ने सिस्टम के निर्देश सेट किए हैं. फ़िलहाल, सिर्फ़ टेक्स्ट.
generationConfig
object (GenerationConfig
)
ज़रूरी नहीं. मॉडल जनरेशन और आउटपुट के लिए कॉन्फ़िगरेशन के विकल्प.
cachedContent
string
ज़रूरी नहीं. कैश मेमोरी में सेव किए गए कॉन्टेंट का नाम. इसका इस्तेमाल, अनुमान दिखाने के लिए कॉन्टेक्स्ट के तौर पर किया जाता है. फ़ॉर्मैट: cachedContents/{cachedContent}
अनुरोध का उदाहरण
टेक्स्ट
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
इमेज
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
ऑडियो
Python
Node.js
शेल
वीडियो
Python
Node.js
शुरू करें
शेल
Python
शेल
चैट करें
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
कैश मेमोरी
Python
Node.js
ट्यून किया गया मॉडल
Python
JSON मोड
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
कोड चलाना
Python
Kotlin
Java
फ़ंक्शन कॉल करना
Python
Node.js
शेल
Kotlin
Swift
Dart
Java
जनरेशन कॉन्फ़िगरेशन
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
सुरक्षा सेटिंग
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
सिस्टम से जुड़े निर्देश
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में GenerateContentResponse
का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.streamGenerateContent
इनपुट GenerateContentRequest
के आधार पर, मॉडल से स्ट्रीम किया गया जवाब जनरेट करता है.
एंडपॉइंट
पोस्टhttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:streamGenerateContent
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
पाथ पैरामीटर
model
string
ज़रूरी है. Model
का नाम, जिसका इस्तेमाल पूरा होने की जानकारी जनरेट करने के लिए किया जाएगा.
फ़ॉर्मैट: models/{model}
. यह tunedModels/{tunedmodel}
फ़ॉर्मैट में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में नीचे दिए गए स्ट्रक्चर वाला डेटा होता है:
tools[]
object (Tool
)
ज़रूरी नहीं. Tools
की सूची, जिसका इस्तेमाल Model
अगला रिस्पॉन्स जनरेट करने के लिए कर सकता है.
Tool
एक कोड है, जो सिस्टम को बाहरी सिस्टम के साथ इंटरैक्ट करने की सुविधा देता है. इससे सिस्टम, Model
के दायरे और जानकारी के बाहर कोई कार्रवाई या कार्रवाइयों का सेट कर सकता है. Tool
के तौर पर Function
और codeExecution
का इस्तेमाल किया जा सकता है. ज़्यादा जानने के लिए, फ़ंक्शन कॉल करने और कोड लागू करने से जुड़ी गाइड देखें.
toolConfig
object (ToolConfig
)
ज़रूरी नहीं. अनुरोध में बताए गए किसी भी Tool
के लिए टूल कॉन्फ़िगरेशन. इस्तेमाल के उदाहरण के लिए, फ़ंक्शन कॉल करने की गाइड देखें.
safetySettings[]
object (SafetySetting
)
ज़रूरी नहीं. असुरक्षित कॉन्टेंट को ब्लॉक करने के लिए, यूनीक SafetySetting
इंस्टेंस की सूची.
यह GenerateContentRequest.contents
और GenerateContentResponse.candidates
पर लागू होगा. हर SafetyCategory
टाइप के लिए, एक से ज़्यादा सेटिंग नहीं होनी चाहिए. एपीआई, उन सभी कॉन्टेंट और रिस्पॉन्स को ब्लॉक कर देगा जो इन सेटिंग के थ्रेशोल्ड को पूरा नहीं करते. यह सूची, safetySettings में बताए गए हर SafetyCategory
के लिए डिफ़ॉल्ट सेटिंग को बदल देती है. अगर सूची में दी गई किसी SafetyCategory
के लिए कोई SafetySetting
नहीं है, तो एपीआई उस कैटगरी के लिए सुरक्षा की डिफ़ॉल्ट सेटिंग का इस्तेमाल करेगा. नुकसान पहुंचाने वाली कैटगरी HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_CIVIC_INTEGRITY का इस्तेमाल किया जा सकता है. सुरक्षा से जुड़ी उपलब्ध सेटिंग के बारे में ज़्यादा जानकारी के लिए, गाइड देखें. अपने एआई ऐप्लिकेशन में सुरक्षा से जुड़ी बातों को शामिल करने का तरीका जानने के लिए, सुरक्षा से जुड़े दिशा-निर्देश भी देखें.
systemInstruction
object (Content
)
ज़रूरी नहीं. डेवलपर ने सिस्टम के निर्देश सेट किए हैं. फ़िलहाल, सिर्फ़ टेक्स्ट.
generationConfig
object (GenerationConfig
)
ज़रूरी नहीं. मॉडल जनरेशन और आउटपुट के लिए कॉन्फ़िगरेशन के विकल्प.
cachedContent
string
ज़रूरी नहीं. कैश मेमोरी में सेव किए गए कॉन्टेंट का नाम. इसका इस्तेमाल, अनुमान दिखाने के लिए कॉन्टेक्स्ट के तौर पर किया जाता है. फ़ॉर्मैट: cachedContents/{cachedContent}
अनुरोध का उदाहरण
टेक्स्ट
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
इमेज
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
ऑडियो
Python
शेल
वीडियो
Python
Node.js
शुरू करें
शेल
Python
शेल
चैट करें
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में GenerateContentResponse
इंस्टेंस की स्ट्रीम शामिल होती है.
तरीका: tunedModels.get
किसी TunedModel के बारे में जानकारी पाता है.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=tunedModels /*}
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल के संसाधन का नाम.
फ़ॉर्मैट: tunedModels/my-model-id
यह tunedModels/{tunedmodel}
फ़ॉर्मैट में होता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में TunedModel
का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.list
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
ट्यून किए गए मॉडल की सूची बनाता है.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /tunedModels
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
क्वेरी पैरामीटर
pageSize
integer
ज़रूरी नहीं. हर पेज पर, ज़्यादा से ज़्यादा TunedModels
दिखाए जा सकते हैं. ऐसा हो सकता है कि इस सेवा से, ट्यून किए गए कम मॉडल मिलें.
अगर कोई वैल्यू नहीं दी जाती है, तो ज़्यादा से ज़्यादा 10 ट्यून किए गए मॉडल दिखाए जाएंगे. इस तरीके से, हर पेज पर ज़्यादा से ज़्यादा 1,000 मॉडल दिखते हैं. भले ही, आपने ज़्यादा pageSize पास किया हो.
pageToken
string
ज़रूरी नहीं. पेज टोकन, जो पिछले tunedModels.list
कॉल से मिला था.
अगला पेज पाने के लिए, एक अनुरोध से मिला pageToken
, अगले अनुरोध के आर्ग्युमेंट के तौर पर दें.
पेजेशन करते समय, tunedModels.list
को दिए गए सभी अन्य पैरामीटर, उस कॉल से मेल खाने चाहिए जिसने पेज टोकन दिया था.
filter
string
ज़रूरी नहीं. फ़िल्टर, ट्यून किए गए मॉडल की जानकारी और डिसप्ले नेम के लिए पूरी टेक्स्ट खोज है. डिफ़ॉल्ट रूप से, नतीजों में सभी के साथ शेयर किए गए ट्यून किए गए मॉडल शामिल नहीं होंगे.
अन्य ऑपरेटर: - owner:me - writers:me - readers:me - readers:everyone
उदाहरण: "owner:me", ट्यून किए गए ऐसे सभी मॉडल दिखाता है जिनके लिए कॉलर के पास मालिकाना हक की भूमिका होती है "readers:me", ट्यून किए गए ऐसे सभी मॉडल दिखाता है जिनके लिए कॉलर के पास रीडर की भूमिका होती है "readers:everyone", ट्यून किए गए ऐसे सभी मॉडल दिखाता है जिन्हें सभी के साथ शेयर किया गया है
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
tunedModels.list
से मिला जवाब, जिसमें पेज पर मौजूद मॉडल की सूची शामिल है.
अगर एपीआई सही से जुड़ जाता है, ताे जवाब के मुख्य भाग में नीचे दिए गए स्ट्रक्चर शामिल होता है.
tunedModels[]
object (TunedModel
)
लौटाए गए मॉडल.
nextPageToken
string
अगला पेज पाने के लिए, pageToken
के तौर पर भेजा जा सकने वाला टोकन.
अगर इस फ़ील्ड को छोड़ा जाता है, तो इसका मतलब है कि कोई और पेज नहीं है.
JSON के काेड में दिखाना |
---|
{
"tunedModels": [
{
object ( |
तरीका: tunedModels.patch
ट्यून किए गए मॉडल को अपडेट करता है.
एंडपॉइंट
पैचhttps: / /generativelanguage.googleapis.com /v1beta /{tunedModel.name=tunedModels /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{tunedModel.name=tunedModels/*}
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
पाथ पैरामीटर
tunedModel.name
string
सिर्फ़ आउटपुट के लिए. ट्यून किए गए मॉडल का नाम. बनाने पर, एक यूनीक नाम जनरेट हो जाएगा. उदाहरण: tunedModels/az2mb0bpw6i
अगर displayName को बनाते समय सेट किया जाता है, तो नाम का आईडी हिस्सा सेट हो जाएगा. इसके लिए, displayName के शब्दों को हाइफ़न के साथ जोड़कर, यूनीक बनाने के लिए कोई रैंडम हिस्सा जोड़ा जाएगा.
उदाहरण:
- displayName =
Sentence Translator
- name =
tunedModels/sentence-translator-u3b7m
यहtunedModels/{tunedmodel}
फ़ॉर्मैट में होता है.
क्वेरी पैरामीटर
updateMask
string (FieldMask
format)
ज़रूरी नहीं. अपडेट किए जाने वाले फ़ील्ड की सूची.
यह फ़ील्ड के पूरी तरह से क्वालिफ़ाइड नामों की सूची है. इसमें नामों को कॉमा लगाकर अलग किया गया है. उदाहरण: "user.displayName,photo"
.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में TunedModel
का उदाहरण है.
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखाया जाने वाला नाम. डिसप्ले नेम में स्पेस के साथ 40 से ज़्यादा वर्ण नहीं होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
tuningTask
object (TuningTask
)
ज़रूरी है. ट्यूनिंग टास्क, जो ट्यून किया गया मॉडल बनाता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model
इनमें से कोई एक हो सकता है:tunedModelSource
object (TunedModelSource
)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेनिंग देने के लिए शुरुआती पॉइंट के तौर पर किया जाता है.
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमिटी को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0]
से ज़्यादा हो सकती हैं. 1.0
के करीब की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0
के करीब की वैल्यू से, आम तौर पर मॉडल से कम चौंकाने वाले जवाब मिलेंगे.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
topP
number
ज़रूरी नहीं. Nucleus सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को शामिल किया जाता है, जिनकी संभावना का योग कम से कम topP
होता है.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे संभावित टोकन के सेट को ध्यान में रखा जाता है. इस वैल्यू से पता चलता है कि मॉडल को कॉल करते समय, बैकएंड किस डिफ़ॉल्ट वैल्यू का इस्तेमाल करेगा.
इस वैल्यू से यह तय होता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करेगा.
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में TunedModel
का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.delete
ट्यून किया गया मॉडल मिटाता है.
एंडपॉइंट
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=tunedModels /*}
यूआरएल में gRPC ट्रांसकोडिंग सिंटैक्स का इस्तेमाल किया गया है.
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल के संसाधन का नाम. फ़ॉर्मैट: tunedModels/my-model-id
यह tunedModels/{tunedmodel}
फ़ॉर्मैट में होता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
जवाब का मुख्य भाग
अगर एपीआई सही से जुड़ जाता है, तो रिस्पॉन्स बॉडी में खाली JSON ऑब्जेक्ट होता है.
REST रिसॉर्स: tunedModels
- संसाधन: TunedModel
- TunedModelSource
- राज्य
- TuningTask
- TuningSnapshot
- डेटासेट
- TuningExamples
- TuningExample
- हाइपरपैरामीटर
- तरीके
रिसॉर्स: TunedModel
ModelService.CreateTunedModel का इस्तेमाल करके बनाया गया बेहतर मॉडल.
name
string
सिर्फ़ आउटपुट के लिए. ट्यून किए गए मॉडल का नाम. बनाने पर, एक यूनीक नाम जनरेट हो जाएगा. उदाहरण: tunedModels/az2mb0bpw6i
अगर displayName को बनाते समय सेट किया जाता है, तो नाम का आईडी हिस्सा सेट हो जाएगा. इसके लिए, displayName के शब्दों को हाइफ़न के साथ जोड़कर, यूनीक बनाने के लिए कोई रैंडम हिस्सा जोड़ा जाएगा.
उदाहरण:
- displayName =
Sentence Translator
- name =
tunedModels/sentence-translator-u3b7m
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखाया जाने वाला नाम. डिसप्ले नेम में स्पेस के साथ 40 से ज़्यादा वर्ण नहीं होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
state
enum (State
)
सिर्फ़ आउटपुट के लिए. ट्यून किए गए मॉडल की स्थिति.
createTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को बनाने का टाइमस्टैंप.
आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होगा और इसमें 0, 3, 6 या 9 दशमलव अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
updateTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को अपडेट किए जाने का टाइमस्टैंप.
आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होगा और इसमें 0, 3, 6 या 9 दशमलव अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
tuningTask
object (TuningTask
)
ज़रूरी है. ट्यूनिंग टास्क, जो ट्यून किया गया मॉडल बनाता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model
इनमें से कोई एक हो सकता है:tunedModelSource
object (TunedModelSource
)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेनिंग देने के लिए शुरुआती पॉइंट के तौर पर किया जाता है.
baseModel
string
इम्यूटेबल. ट्यून करने के लिए Model
का नाम. उदाहरण: models/gemini-1.5-flash-001
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमिटी को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0]
से ज़्यादा हो सकती हैं. 1.0
के करीब की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0
के करीब की वैल्यू से, आम तौर पर मॉडल से कम चौंकाने वाले जवाब मिलेंगे.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
topP
number
ज़रूरी नहीं. Nucleus सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को शामिल किया जाता है, जिनकी संभावना का योग कम से कम topP
होता है.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे संभावित टोकन के सेट को ध्यान में रखा जाता है. इस वैल्यू से पता चलता है कि मॉडल को कॉल करते समय, बैकएंड किस डिफ़ॉल्ट वैल्यू का इस्तेमाल करेगा.
इस वैल्यू से यह पता चलता है कि मॉडल बनाते समय, बेस मॉडल किस वैल्यू का इस्तेमाल करता है.
JSON के काेड में दिखाना |
---|
{ "name": string, "displayName": string, "description": string, "state": enum ( |
TunedModelSource
नए मॉडल को ट्रेन करने के लिए, ट्यून किया गया मॉडल सोर्स के तौर पर इस्तेमाल किया जाता है.
tunedModel
string
इम्यूटेबल. नए मॉडल को ट्रेनिंग देने के लिए, शुरुआती पॉइंट के तौर पर इस्तेमाल किए जाने वाले TunedModel
का नाम. उदाहरण: tunedModels/my-tuned-model
baseModel
string
सिर्फ़ आउटपुट के लिए. उस बेस Model
का नाम जिससे इस TunedModel
को ट्यून किया गया था. उदाहरण: models/gemini-1.5-flash-001
JSON के काेड में दिखाना |
---|
{ "tunedModel": string, "baseModel": string } |
स्थिति
ट्यून किए गए मॉडल की स्थिति.
Enums | |
---|---|
STATE_UNSPECIFIED |
डिफ़ॉल्ट वैल्यू. इस वैल्यू का इस्तेमाल नहीं किया जाता. |
CREATING |
मॉडल बनाया जा रहा है. |
ACTIVE |
मॉडल इस्तेमाल के लिए तैयार है. |
FAILED |
मॉडल नहीं बनाया जा सका. |
TuningTask
ट्यून किए गए मॉडल बनाने वाले ट्यूनिंग टास्क.
startTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल की ट्यूनिंग शुरू होने का टाइमस्टैंप.
आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होगा और इसमें 0, 3, 6 या 9 दशमलव अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
completeTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को ट्यून करने के बाद का टाइमस्टैंप.
आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होगा और इसमें 0, 3, 6 या 9 दशमलव अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
snapshots[]
object (TuningSnapshot
)
सिर्फ़ आउटपुट के लिए. ट्यूनिंग के दौरान इकट्ठा की गई मेट्रिक.
trainingData
object (Dataset
)
ज़रूरी है. सिर्फ़ इनपुट के लिए. इम्यूटेबल. मॉडल को ट्रेनिंग देने के लिए इस्तेमाल किया जाने वाला डेटा.
hyperparameters
object (Hyperparameters
)
इम्यूटेबल. ट्यूनिंग की प्रोसेस को कंट्रोल करने वाले हाइपरपैरामीटर. अगर यह वैल्यू नहीं दी जाती है, तो डिफ़ॉल्ट वैल्यू का इस्तेमाल किया जाएगा.
JSON के काेड में दिखाना |
---|
{ "startTime": string, "completeTime": string, "snapshots": [ { object ( |
TuningSnapshot
ट्यून करने के किसी एक चरण के लिए रिकॉर्ड करें.
step
integer
सिर्फ़ आउटपुट के लिए. ट्यून करने का चरण.
epoch
integer
सिर्फ़ आउटपुट के लिए. वह इक्वोक (समान समय) जब यह चरण पूरा हुआ.
meanLoss
number
सिर्फ़ आउटपुट के लिए. इस चरण के लिए, ट्रेनिंग के उदाहरणों का औसत लॉस.
computeTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मेट्रिक का हिसाब लगाने का टाइमस्टैंप.
आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होगा और इसमें 0, 3, 6 या 9 दशमलव अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
JSON के काेड में दिखाना |
---|
{ "step": integer, "epoch": integer, "meanLoss": number, "computeTime": string } |
डेटासेट
ट्रेनिंग या पुष्टि के लिए डेटासेट.
dataset
Union type
dataset
इनमें से कोई एक हो सकता है:examples
object (TuningExamples
)
ज़रूरी नहीं. इनलाइन उदाहरण, जिनमें आसान इनपुट/आउटपुट टेक्स्ट है.
JSON के काेड में दिखाना |
---|
{
// dataset
"examples": {
object ( |
TuningExamples
ट्यूनिंग के उदाहरणों का एक सेट. यह ट्रेनिंग या पुष्टि करने वाला डेटा हो सकता है.
examples[]
object (TuningExample
)
उदाहरण. उदाहरण के तौर पर, टेक्स्ट या चर्चा के लिए इनपुट दिया जा सकता है. हालांकि, किसी सेट में सभी उदाहरण एक ही तरह के होने चाहिए.
JSON के काेड में दिखाना |
---|
{
"examples": [
{
object ( |
TuningExample
ट्यूनिंग के लिए एक उदाहरण.
output
string
ज़रूरी है. मॉडल से मिलने वाला अनुमानित आउटपुट.
model_input
Union type
model_input
इनमें से कोई एक हो सकता है:textInput
string
ज़रूरी नहीं. टेक्स्ट मॉडल इनपुट.
JSON के काेड में दिखाना |
---|
{ "output": string, // model_input "textInput": string // Union type } |
हाइपर पैरामीटर
ट्यूनिंग की प्रोसेस को कंट्रोल करने वाले हाइपरपैरामीटर. ज़्यादा जानने के लिए, https://ai.google.dev/docs/model_tuning_guidance पर जाएं
learning_rate_option
Union type
learning_rate_option
इनमें से कोई एक हो सकता है:learningRate
number
ज़रूरी नहीं. इम्यूटेबल. ट्यूनिंग के लिए, लर्निंग रेट हाइपरपैरामीटर. अगर यह सेट नहीं किया जाता है, तो ट्रेनिंग के उदाहरणों की संख्या के आधार पर, डिफ़ॉल्ट रूप से 0.001 या 0.0002 का हिसाब लगाया जाएगा.
learningRateMultiplier
number
ज़रूरी नहीं. इम्यूटेबल. लर्निंग रेट मल्टीप्लायर का इस्तेमाल, डिफ़ॉल्ट (सुझाई गई) वैल्यू के आधार पर, लर्निंग रेट का हिसाब लगाने के लिए किया जाता है. असल लर्निंग रेट := लर्निंग रेट मल्टीप्लायर * डिफ़ॉल्ट लर्निंग रेट. डिफ़ॉल्ट लर्निंग रेट, बेस मॉडल और डेटासेट के साइज़ पर निर्भर करता है. अगर यह सेट नहीं है, तो डिफ़ॉल्ट रूप से 1.0 का इस्तेमाल किया जाएगा.
epochCount
integer
इम्यूटेबल. ट्रेनिंग के एपिसोड की संख्या. एक एपिसोड, ट्रेनिंग डेटा के एक पास को कहते हैं. अगर यह सेट नहीं है, तो डिफ़ॉल्ट रूप से 5 का इस्तेमाल किया जाएगा.
batchSize
integer
इम्यूटेबल. ट्यूनिंग के लिए, बैच साइज़ हाइपरपैरामीटर. अगर यह सेट नहीं है, तो ट्रेनिंग के उदाहरणों की संख्या के आधार पर, डिफ़ॉल्ट रूप से 4 या 16 का इस्तेमाल किया जाएगा.
JSON के काेड में दिखाना |
---|
{ // learning_rate_option "learningRate": number, "learningRateMultiplier": number // Union type "epochCount": integer, "batchSize": integer } |