Gemini API में फ़ाइन ट्यूनिंग की सुविधा उपलब्ध है. इसकी मदद से, इनपुट/आउटपुट के उदाहरणों का छोटा डेटासेट होने पर भी, आउटपुट को बेहतर बनाया जा सकता है. ज़्यादा जानकारी के लिए, मॉडल ट्यूनिंग गाइड और ट्यूटोरियल देखें.
तरीका: tunedModels.create
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
इसकी मदद से, ट्यून किया गया मॉडल बनाया जाता है. google.longrunning.Operations सेवा के ज़रिए, इंटरमीडिएट ट्यूनिंग की प्रोग्रेस देखें.
Operations सेवा के ज़रिए, कार्रवाई की स्थिति और नतीजे ऐक्सेस करें. उदाहरण: GET /v1/tunedModels/az2mb0bpw6i/operations/000-111-222
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /tunedModels
क्वेरी पैरामीटर
tunedModelId
string
ज़रूरी नहीं. अगर ट्यून किए गए मॉडल के लिए यूनीक आईडी दिया गया है, तो यह फ़ील्ड उस आईडी को दिखाता है. इस वैल्यू में ज़्यादा से ज़्यादा 40 वर्ण होने चाहिए. पहला वर्ण कोई अक्षर होना चाहिए और आखिरी वर्ण कोई अक्षर या संख्या हो सकती है. आईडी, इस रेगुलर एक्सप्रेशन से मेल खाना चाहिए: [a-z]([a-z0-9-]{0,38}[a-z0-9])?.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में TunedModel का उदाहरण है.
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखने वाला नाम. डिसप्ले नेम में स्पेस के साथ-साथ 40 वर्ण होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
tuningTask
object (TuningTask)
ज़रूरी है. ट्यूनिंग टास्क, जिससे ट्यून किया गया मॉडल बनता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model इनमें से सिर्फ़ एक हो सकता है:tunedModelSource
object (TunedModelSource)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा.
baseModel
string
इम्यूटेबल. ट्यून करने के लिए Model का नाम. उदाहरण: models/gemini-1.5-flash-001
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0] तक हो सकती हैं. 1.0 के आस-पास की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0 के आस-पास की वैल्यू से, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topP
number
ज़रूरी नहीं. न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को ध्यान में रखा जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP होता है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
अगर अनुरोध पूरा हो जाता है, तो जवाब के मुख्य हिस्से में Operation का नया इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.generateContent
यह फ़ंक्शन, इनपुट GenerateContentRequest के आधार पर मॉडल का जवाब जनरेट करता है. इस्तेमाल से जुड़ी ज़्यादा जानकारी के लिए, टेक्स्ट जनरेट करने से जुड़ी गाइड देखें. ट्यून किए गए मॉडल के साथ-साथ अन्य मॉडल के लिए, इनपुट देने की सुविधाएं अलग-अलग होती हैं. ज़्यादा जानकारी के लिए, मॉडल गाइड और ट्यूनिंग गाइड देखें.
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:generateContent
पाथ पैरामीटर
model
string
ज़रूरी है. Model का नाम, जिसका इस्तेमाल जवाब जनरेट करने के लिए किया जाना है.
फ़ॉर्मैट: models/{model}. यह tunedModels/{tunedmodel} के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य हिस्से में, इस स्ट्रक्चर का डेटा शामिल होता है:
tools[]
object (Tool)
ज़रूरी नहीं. Tools की एक सूची, जिसका इस्तेमाल Model अगले जवाब को जनरेट करने के लिए कर सकता है.
Tool एक कोड होता है. इसकी मदद से सिस्टम, बाहरी सिस्टम के साथ इंटरैक्ट कर पाता है. इससे Model के दायरे से बाहर कोई कार्रवाई या कार्रवाइयों का सेट किया जा सकता है. Function और codeExecution, Tool के साथ काम करते हैं. ज़्यादा जानने के लिए, फ़ंक्शन कॉल करने की सुविधा और कोड एक्ज़ीक्यूट करने की सुविधा के बारे में जानकारी देने वाली गाइड पढ़ें.
toolConfig
object (ToolConfig)
ज़रूरी नहीं. अनुरोध में बताए गए किसी भी Tool के लिए टूल कॉन्फ़िगरेशन. इस्तेमाल का उदाहरण देखने के लिए, फ़ंक्शन कॉलिंग गाइड देखें.
safetySettings[]
object (SafetySetting)
ज़रूरी नहीं. असुरक्षित कॉन्टेंट को ब्लॉक करने के लिए, यूनीक SafetySetting इंस्टेंस की सूची.
यह GenerateContentRequest.contents और GenerateContentResponse.candidates पर लागू होगा. हर SafetyCategory टाइप के लिए, एक से ज़्यादा सेटिंग नहीं होनी चाहिए. एपीआई, ऐसे सभी कॉन्टेंट और जवाबों को ब्लॉक कर देगा जो इन सेटिंग के ज़रिए तय की गई थ्रेशोल्ड को पूरा नहीं करते. इस सूची में, safetySettings में बताए गए हर SafetyCategory के लिए डिफ़ॉल्ट सेटिंग को ओवरराइड किया जाता है. अगर सूची में दिए गए किसी SafetyCategory के लिए कोई SafetySetting नहीं है, तो एपीआई उस कैटगरी के लिए डिफ़ॉल्ट सुरक्षा सेटिंग का इस्तेमाल करेगा. इन कैटगरी में आने वाले कॉन्टेंट की पहचान की जा सकती है: HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_CIVIC_INTEGRITY. सुरक्षा से जुड़ी उपलब्ध सेटिंग के बारे में ज़्यादा जानकारी के लिए, गाइड देखें. एआई ऐप्लिकेशन में सुरक्षा से जुड़ी बातों को शामिल करने का तरीका जानने के लिए, सुरक्षा से जुड़े दिशा-निर्देश भी पढ़ें.
systemInstruction
object (Content)
ज़रूरी नहीं. डेवलपर ने सिस्टम के लिए निर्देश सेट किए हैं. फ़िलहाल, सिर्फ़ टेक्स्ट.
generationConfig
object (GenerationConfig)
ज़रूरी नहीं. मॉडल जनरेट करने और आउटपुट के लिए कॉन्फ़िगरेशन के विकल्प.
cachedContent
string
ज़रूरी नहीं. कॉन्टेंट का वह नाम जिसे कैश मेमोरी में सेव किया गया है, ताकि अनुमान लगाने के लिए कॉन्टेक्स्ट के तौर पर इसका इस्तेमाल किया जा सके. फ़ॉर्मैट: cachedContents/{cachedContent}
अनुरोध का उदाहरण
टेक्स्ट
Python
Node.js
ऐप पर जाएं
शेल
Java
इमेज
Python
Node.js
ऐप पर जाएं
शेल
Java
ऑडियो
Python
Node.js
ऐप पर जाएं
शेल
वीडियो
Python
Node.js
ऐप पर जाएं
शेल
Python
ऐप पर जाएं
शेल
चैट
Python
Node.js
ऐप पर जाएं
शेल
Java
कैश मेमोरी
Python
Node.js
ऐप पर जाएं
फ़ाइन-ट्यून किया गया मॉडल
Python
JSON मोड
Python
Node.js
ऐप पर जाएं
शेल
Java
कोड को चलाना
Python
ऐप पर जाएं
Java
फ़ंक्शन कॉलिंग
Python
ऐप पर जाएं
Node.js
शेल
Java
जनरेशन कॉन्फ़िगरेशन
Python
Node.js
ऐप पर जाएं
शेल
Java
सुरक्षा सेटिंग
Python
Node.js
ऐप पर जाएं
शेल
Java
सिस्टम के निर्देश
Python
Node.js
ऐप पर जाएं
शेल
Java
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में GenerateContentResponse का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.streamGenerateContent
यह फ़ंक्शन, इनपुट GenerateContentRequest के आधार पर मॉडल से स्ट्रीम किया गया जवाब जनरेट करता है.
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:streamGenerateContent
पाथ पैरामीटर
model
string
ज़रूरी है. Model का नाम, जिसका इस्तेमाल जवाब जनरेट करने के लिए किया जाना है.
फ़ॉर्मैट: models/{model}. यह tunedModels/{tunedmodel} के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य हिस्से में, इस स्ट्रक्चर का डेटा शामिल होता है:
tools[]
object (Tool)
ज़रूरी नहीं. Tools की एक सूची, जिसका इस्तेमाल Model अगले जवाब को जनरेट करने के लिए कर सकता है.
Tool एक कोड होता है. इसकी मदद से सिस्टम, बाहरी सिस्टम के साथ इंटरैक्ट कर पाता है. इससे Model के दायरे से बाहर कोई कार्रवाई या कार्रवाइयों का सेट किया जा सकता है. Function और codeExecution, Tool के साथ काम करते हैं. ज़्यादा जानने के लिए, फ़ंक्शन कॉल करने की सुविधा और कोड एक्ज़ीक्यूट करने की सुविधा के बारे में जानकारी देने वाली गाइड पढ़ें.
toolConfig
object (ToolConfig)
ज़रूरी नहीं. अनुरोध में बताए गए किसी भी Tool के लिए टूल कॉन्फ़िगरेशन. इस्तेमाल का उदाहरण देखने के लिए, फ़ंक्शन कॉलिंग गाइड देखें.
safetySettings[]
object (SafetySetting)
ज़रूरी नहीं. असुरक्षित कॉन्टेंट को ब्लॉक करने के लिए, यूनीक SafetySetting इंस्टेंस की सूची.
यह GenerateContentRequest.contents और GenerateContentResponse.candidates पर लागू होगा. हर SafetyCategory टाइप के लिए, एक से ज़्यादा सेटिंग नहीं होनी चाहिए. एपीआई, ऐसे सभी कॉन्टेंट और जवाबों को ब्लॉक कर देगा जो इन सेटिंग के ज़रिए तय की गई थ्रेशोल्ड को पूरा नहीं करते. इस सूची में, safetySettings में बताए गए हर SafetyCategory के लिए डिफ़ॉल्ट सेटिंग को ओवरराइड किया जाता है. अगर सूची में दिए गए किसी SafetyCategory के लिए कोई SafetySetting नहीं है, तो एपीआई उस कैटगरी के लिए डिफ़ॉल्ट सुरक्षा सेटिंग का इस्तेमाल करेगा. इन कैटगरी में आने वाले कॉन्टेंट की पहचान की जा सकती है: HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_CIVIC_INTEGRITY. सुरक्षा से जुड़ी उपलब्ध सेटिंग के बारे में ज़्यादा जानकारी के लिए, गाइड देखें. एआई ऐप्लिकेशन में सुरक्षा से जुड़ी बातों को शामिल करने का तरीका जानने के लिए, सुरक्षा से जुड़े दिशा-निर्देश भी पढ़ें.
systemInstruction
object (Content)
ज़रूरी नहीं. डेवलपर ने सिस्टम के लिए निर्देश सेट किए हैं. फ़िलहाल, सिर्फ़ टेक्स्ट.
generationConfig
object (GenerationConfig)
ज़रूरी नहीं. मॉडल जनरेट करने और आउटपुट के लिए कॉन्फ़िगरेशन के विकल्प.
cachedContent
string
ज़रूरी नहीं. कॉन्टेंट का वह नाम जिसे कैश मेमोरी में सेव किया गया है, ताकि अनुमान लगाने के लिए कॉन्टेक्स्ट के तौर पर इसका इस्तेमाल किया जा सके. फ़ॉर्मैट: cachedContents/{cachedContent}
अनुरोध का उदाहरण
टेक्स्ट
Python
Node.js
ऐप पर जाएं
शेल
Java
इमेज
Python
Node.js
ऐप पर जाएं
शेल
Java
ऑडियो
Python
ऐप पर जाएं
शेल
वीडियो
Python
Node.js
ऐप पर जाएं
शेल
Python
ऐप पर जाएं
शेल
चैट
Python
Node.js
ऐप पर जाएं
शेल
Java
जवाब का मुख्य भाग
अगर एपीआई सही से जुड़ जाता है, तो जवाब के मुख्य हिस्से में GenerateContentResponse इंस्टेंस की एक स्ट्रीम शामिल होती है.
तरीका: tunedModels.get
इस तरीके से, किसी खास TunedModel के बारे में जानकारी मिलती है.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=tunedModels /*}
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल का संसाधन नाम.
फ़ॉर्मैट: tunedModels/my-model-id यह tunedModels/{tunedmodel} के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में TunedModel का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.list
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
ट्यून किए गए मॉडल की सूचियां.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /tunedModels
क्वेरी पैरामीटर
pageSize
integer
ज़रूरी नहीं. हर पेज पर, ज़्यादा से ज़्यादा TunedModels नतीजे दिखाए जा सकते हैं. ऐसा हो सकता है कि सेवा, कम फ़ाइन-ट्यून किए गए मॉडल दिखाए.
अगर इसे तय नहीं किया गया है, तो ज़्यादा से ज़्यादा 10 ट्यून किए गए मॉडल दिखेंगे. इस तरीके से, हर पेज पर ज़्यादा से ज़्यादा 1,000 मॉडल दिखते हैं. भले ही, आपने pageSize की बड़ी वैल्यू पास की हो.
pageToken
string
ज़रूरी नहीं. यह एक पेज टोकन है, जो पिछले tunedModels.list कॉल से मिला था.
अगले पेज को वापस पाने के लिए, एक अनुरोध से मिले pageToken को अगले अनुरोध के लिए आर्ग्युमेंट के तौर पर इस्तेमाल करें.
पेज नंबर के हिसाब से डेटा दिखाने के दौरान, tunedModels.list को दिए गए अन्य सभी पैरामीटर, पेज टोकन देने वाले कॉल से मेल खाने चाहिए.
filter
string
ज़रूरी नहीं. फ़िल्टर, ट्यून किए गए मॉडल की जानकारी और डिसप्ले नेम में पूरे टेक्स्ट की खोज करता है. डिफ़ॉल्ट रूप से, नतीजों में ऐसे ट्यून किए गए मॉडल शामिल नहीं किए जाएंगे जिन्हें सभी के साथ शेयर किया गया है.
अन्य ऑपरेटर: - owner:me - writers:me - readers:me - readers:everyone
उदाहरण: "owner:me" से, ट्यून किए गए वे सभी मॉडल दिखते हैं जिनके लिए कॉलर के पास मालिक की भूमिका है "readers:me" से, ट्यून किए गए वे सभी मॉडल दिखते हैं जिनके लिए कॉलर के पास दर्शक की भूमिका है "readers:everyone" से, ट्यून किए गए वे सभी मॉडल दिखते हैं जिन्हें सभी के साथ शेयर किया गया है
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
tunedModels.list से मिला जवाब, जिसमें मॉडल की पेज के हिसाब से बांटी गई सूची होती है.
अगर एपीआई सही से जुड़ जाता है, ताे जवाब के मुख्य भाग में नीचे दिए गए स्ट्रक्चर शामिल होता है.
tunedModels[]
object (TunedModel)
लौटाए गए मॉडल.
nextPageToken
string
यह एक टोकन है. इसका इस्तेमाल अगले पेज को वापस पाने के लिए, pageToken के तौर पर किया जा सकता है.
अगर इस फ़ील्ड को शामिल नहीं किया जाता है, तो इसका मतलब है कि कोई और पेज नहीं है.
| JSON के काेड में दिखाना |
|---|
{
"tunedModels": [
{
object ( |
तरीका: tunedModels.patch
इस तरीके का इस्तेमाल करके, फ़ाइन-ट्यून किए गए मॉडल को अपडेट किया जा सकता है.
एंडपॉइंट
patchhttps: / /generativelanguage.googleapis.com /v1beta /{tunedModel.name=tunedModels /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{tunedModel.name=tunedModels/*}
पाथ पैरामीटर
tunedModel.name
string
सिर्फ़ आउटपुट के लिए. फ़ाइन-ट्यून किए गए मॉडल का नाम. बनाते समय, एक यूनीक नाम जनरेट किया जाएगा. उदाहरण: tunedModels/az2mb0bpw6i अगर displayName को बनाने के समय सेट किया जाता है, तो नाम के आईडी वाले हिस्से को displayName के शब्दों को हाइफ़न के साथ जोड़कर सेट किया जाएगा. साथ ही, इसे यूनीक बनाने के लिए एक रैंडम हिस्सा जोड़ा जाएगा.
उदाहरण:
- displayName =
Sentence Translator - name =
tunedModels/sentence-translator-u3b7mयहtunedModels/{tunedmodel}के फ़ॉर्म में होता है.
क्वेरी पैरामीटर
updateMask
string (FieldMask format)
ज़रूरी नहीं. अपडेट किए जाने वाले फ़ील्ड की सूची.
यह फ़ील्ड के पूरी तरह से क्वालिफ़ाइड नामों की कॉमा से अलग की गई सूची है. उदाहरण: "user.displayName,photo".
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में TunedModel का उदाहरण है.
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखने वाला नाम. डिसप्ले नेम में स्पेस के साथ-साथ 40 वर्ण होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
tuningTask
object (TuningTask)
ज़रूरी है. ट्यूनिंग टास्क, जिससे ट्यून किया गया मॉडल बनता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model इनमें से सिर्फ़ एक हो सकता है:tunedModelSource
object (TunedModelSource)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा.
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0] तक हो सकती हैं. 1.0 के आस-पास की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0 के आस-पास की वैल्यू से, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topP
number
ज़रूरी नहीं. न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को ध्यान में रखा जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP होता है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में TunedModel का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.delete
इस तरीके का इस्तेमाल करके, फ़ाइन-ट्यून किए गए मॉडल को मिटाया जा सकता है.
एंडपॉइंट
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=tunedModels /*}
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल का संसाधन नाम. फ़ॉर्मैट: tunedModels/my-model-id यह tunedModels/{tunedmodel} के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
जवाब का मुख्य भाग
अगर अनुरोध पूरा हो जाता है, तो जवाब के मुख्य हिस्से में एक खाली JSON ऑब्जेक्ट होता है.
REST रिसॉर्स: tunedModels
- संसाधन: TunedModel
- TunedModelSource
- राज्य
- TuningTask
- TuningSnapshot
- डेटासेट
- TuningExamples
- TuningExample
- हाइपरपैरामीटर
- तरीके
संसाधन: TunedModel
ModelService.CreateTunedModel का इस्तेमाल करके बनाया गया फ़ाइन-ट्यून किया गया मॉडल.
name
string
सिर्फ़ आउटपुट के लिए. फ़ाइन-ट्यून किए गए मॉडल का नाम. बनाते समय, एक यूनीक नाम जनरेट किया जाएगा. उदाहरण: tunedModels/az2mb0bpw6i अगर displayName को बनाने के समय सेट किया जाता है, तो नाम के आईडी वाले हिस्से को displayName के शब्दों को हाइफ़न के साथ जोड़कर सेट किया जाएगा. साथ ही, इसे यूनीक बनाने के लिए एक रैंडम हिस्सा जोड़ा जाएगा.
उदाहरण:
- displayName =
Sentence Translator - name =
tunedModels/sentence-translator-u3b7m
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखने वाला नाम. डिसप्ले नेम में स्पेस के साथ-साथ 40 वर्ण होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
state
enum (State)
सिर्फ़ आउटपुट के लिए. ट्यून किए गए मॉडल की स्थिति.
createTime
string (Timestamp format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को बनाए जाने का टाइमस्टैंप.
यह आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़ किया जाएगा और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" या "2014-10-02T15:01:23+05:30".
updateTime
string (Timestamp format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को अपडेट किए जाने का टाइमस्टैंप.
यह आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़ किया जाएगा और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" या "2014-10-02T15:01:23+05:30".
tuningTask
object (TuningTask)
ज़रूरी है. ट्यूनिंग टास्क, जिससे ट्यून किया गया मॉडल बनता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model इनमें से सिर्फ़ एक हो सकता है:tunedModelSource
object (TunedModelSource)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा.
baseModel
string
इम्यूटेबल. ट्यून करने के लिए Model का नाम. उदाहरण: models/gemini-1.5-flash-001
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0] तक हो सकती हैं. 1.0 के आस-पास की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0 के आस-पास की वैल्यू से, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topP
number
ज़रूरी नहीं. न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को ध्यान में रखा जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP होता है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
| JSON के काेड में दिखाना |
|---|
{ "name": string, "displayName": string, "description": string, "state": enum ( |
TunedModelSource
ट्यून किए गए मॉडल को नए मॉडल को ट्रेनिंग देने के सोर्स के तौर पर इस्तेमाल किया जा सकता है.
tunedModel
string
इम्यूटेबल. TunedModel का नाम, जिसका इस्तेमाल नए मॉडल को ट्रेनिंग देने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा. उदाहरण: tunedModels/my-tuned-model
baseModel
string
सिर्फ़ आउटपुट के लिए. उस बेस Model का नाम जिससे इस TunedModel को ट्यून किया गया था. उदाहरण: models/gemini-1.5-flash-001
| JSON के काेड में दिखाना |
|---|
{ "tunedModel": string, "baseModel": string } |
राज्य
ट्यून किए गए मॉडल की स्थिति.
| Enums | |
|---|---|
STATE_UNSPECIFIED |
डिफ़ॉल्ट वैल्यू. इस वैल्यू का इस्तेमाल नहीं किया गया है. |
CREATING |
मॉडल बनाया जा रहा है. |
ACTIVE |
मॉडल इस्तेमाल के लिए तैयार है. |
FAILED |
मॉडल नहीं बनाया जा सका. |
TuningTask
ट्यूनिंग टास्क, जिनसे ट्यून किए गए मॉडल बनाए जाते हैं.
startTime
string (Timestamp format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को ट्यून करना शुरू करने का टाइमस्टैंप.
यह आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़ किया जाएगा और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" या "2014-10-02T15:01:23+05:30".
completeTime
string (Timestamp format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को ट्यून करने की प्रोसेस पूरी होने का टाइमस्टैंप.
यह आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़ किया जाएगा और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" या "2014-10-02T15:01:23+05:30".
snapshots[]
object (TuningSnapshot)
सिर्फ़ आउटपुट के लिए. ट्यूनिंग के दौरान इकट्ठा की गई मेट्रिक.
trainingData
object (Dataset)
ज़रूरी है. सिर्फ़ इनपुट के लिए. इम्यूटेबल. मॉडल की ट्रेनिंग के लिए इस्तेमाल किया गया डेटा.
hyperparameters
object (Hyperparameters)
इम्यूटेबल. ट्यूनिंग की प्रोसेस को कंट्रोल करने वाले हाइपरपैरामीटर. अगर यह जानकारी नहीं दी जाती है, तो डिफ़ॉल्ट वैल्यू का इस्तेमाल किया जाएगा.
| JSON के काेड में दिखाना |
|---|
{ "startTime": string, "completeTime": string, "snapshots": [ { object ( |
TuningSnapshot
किसी एक ट्यूनिंग चरण के लिए रिकॉर्डिंग.
step
integer
सिर्फ़ आउटपुट के लिए. ट्यूनिंग का चरण.
epoch
integer
सिर्फ़ आउटपुट के लिए. यह चरण जिस इपॉक का हिस्सा था.
meanLoss
number
सिर्फ़ आउटपुट के लिए. इस चरण के लिए, ट्रेनिंग के उदाहरणों का औसत नुकसान.
computeTime
string (Timestamp format)
सिर्फ़ आउटपुट के लिए. इस मेट्रिक को कंप्यूट किए जाने का टाइमस्टैंप.
यह आरएफ़सी 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़ किया जाएगा और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाएंगे. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" या "2014-10-02T15:01:23+05:30".
| JSON के काेड में दिखाना |
|---|
{ "step": integer, "epoch": integer, "meanLoss": number, "computeTime": string } |
डेटासेट
ट्रेनिंग या पुष्टि के लिए डेटासेट.
dataset
Union type
dataset इनमें से सिर्फ़ एक हो सकता है:examples
object (TuningExamples)
ज़रूरी नहीं. आसान इनपुट/आउटपुट टेक्स्ट वाले इनलाइन उदाहरण.
| JSON के काेड में दिखाना |
|---|
{
// dataset
"examples": {
object ( |
TuningExamples
ट्यूनिंग के उदाहरणों का सेट. यह ट्रेनिंग या पुष्टि करने वाला डेटा हो सकता है.
examples[]
object (TuningExample)
उदाहरण. इनपुट के तौर पर टेक्स्ट या बातचीत का उदाहरण दिया जा सकता है. हालांकि, एक सेट में मौजूद सभी उदाहरण एक ही तरह के होने चाहिए.
| JSON के काेड में दिखाना |
|---|
{
"examples": [
{
object ( |
TuningExample
ट्यूनिंग के लिए एक उदाहरण.
output
string
ज़रूरी है. मॉडल से मिलने वाला अनुमानित आउटपुट.
model_input
Union type
model_input इनमें से सिर्फ़ एक हो सकता है:textInput
string
ज़रूरी नहीं. टेक्स्ट मॉडल का इनपुट.
| JSON के काेड में दिखाना |
|---|
{ "output": string, // model_input "textInput": string // Union type } |
हाइपर पैरामीटर
ट्यूनिंग की प्रोसेस को कंट्रोल करने वाले हाइपरपैरामीटर. ज़्यादा जानने के लिए, https://ai.google.dev/docs/model_tuning_guidance पर जाएं
learning_rate_option
Union type
learning_rate_option इनमें से सिर्फ़ एक हो सकता है:learningRate
number
ज़रूरी नहीं. इम्यूटेबल. ट्यूनिंग के लिए लर्निंग रेट हाइपरपैरामीटर. अगर इसे सेट नहीं किया जाता है, तो ट्रेनिंग के उदाहरणों की संख्या के आधार पर, डिफ़ॉल्ट रूप से 0.001 या 0.0002 का हिसाब लगाया जाएगा.
learningRateMultiplier
number
ज़रूरी नहीं. इम्यूटेबल. लर्निंग रेट मल्टीप्लायर का इस्तेमाल, डिफ़ॉल्ट (सुझाई गई) वैल्यू के आधार पर फ़ाइनल लर्निंगरेट का हिसाब लगाने के लिए किया जाता है. असल लर्निंग रेट := learningRateMultiplier * डिफ़ॉल्ट लर्निंग रेट डिफ़ॉल्ट लर्निंग रेट, बेस मॉडल और डेटासेट के साइज़ पर निर्भर करता है. अगर इसे सेट नहीं किया जाता है, तो डिफ़ॉल्ट तौर पर 1.0 का इस्तेमाल किया जाएगा.
epochCount
integer
इम्यूटेबल. ट्रेनिंग के इपॉक की संख्या. एक इपॉक, ट्रेनिंग डेटा से एक बार गुज़रने की प्रोसेस होती है. अगर इसे सेट नहीं किया जाता है, तो डिफ़ॉल्ट तौर पर 5 का इस्तेमाल किया जाएगा.
batchSize
integer
इम्यूटेबल. ट्यूनिंग के लिए बैच साइज़ हाइपरपैरामीटर. अगर इसे सेट नहीं किया जाता है, तो ट्रेनिंग के उदाहरणों की संख्या के आधार पर, डिफ़ॉल्ट तौर पर 4 या 16 का इस्तेमाल किया जाएगा.
| JSON के काेड में दिखाना |
|---|
{ // learning_rate_option "learningRate": number, "learningRateMultiplier": number // Union type "epochCount": integer, "batchSize": integer } |