Models

मॉडल एंडपॉइंट की मदद से, प्रोग्राम के हिसाब से उपलब्ध मॉडल की सूची बनाई जा सकती है. साथ ही, ज़्यादा मेटाडेटा भी वापस पाया जा सकता है. जैसे, काम करने वाली सुविधाएं और कॉन्टेक्स्ट विंडो का साइज़. ज़्यादा जानने के लिए, मॉडल गाइड पढ़ें.

तरीका: models.get

किसी खास Model के बारे में जानकारी पाता है. जैसे, उसका वर्शन नंबर, टोकन की सीमाएं, पैरामीटर, और अन्य मेटाडेटा. मॉडल के बारे में ज़्यादा जानकारी के लिए, Gemini मॉडल गाइड देखें.

एंडपॉइंट

get https://generativelanguage.googleapis.com/v1beta/{name=models/*}

पाथ पैरामीटर

name string

ज़रूरी है. मॉडल के संसाधन का नाम.

यह नाम, models.list तरीके से मिले मॉडल के नाम से मेल खाना चाहिए.

फ़ॉर्मैट: models/{model} यह models/{model} फ़ॉर्मैट में होता है.

अनुरोध का मुख्य भाग

अनुरोध का मुख्य हिस्सा खाली होना चाहिए.

अनुरोध का उदाहरण

Python

from google import genai

client = genai.Client()
model_info = client.models.get(model="gemini-2.0-flash")
print(model_info)

शेल

curl https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash?key=$GEMINI_API_KEY

जवाब का मुख्य भाग

कामयाब रहने पर, जवाब के मुख्य हिस्से में Model का एक इंस्टेंस शामिल किया जाता है.

तरीका: models.list

Gemini API के ज़रिए उपलब्ध Model की सूची दिखाता है.

एंडपॉइंट

get https://generativelanguage.googleapis.com/v1beta/models

क्वेरी पैरामीटर

pageSize integer

हर पेज पर, ज़्यादा से ज़्यादा Models दिखाए जा सकते हैं.

अगर कोई वैल्यू नहीं दी जाती है, तो हर पेज पर 50 मॉडल दिखाए जाएंगे. इस तरीके से, हर पेज पर ज़्यादा से ज़्यादा 1,000 मॉडल दिखते हैं. भले ही, आपने ज़्यादा pageSize पास किया हो.

pageToken string

पेज टोकन, जो पिछले models.list कॉल से मिला था.

अगला पेज पाने के लिए, एक अनुरोध से मिला pageToken, अगले अनुरोध के आर्ग्युमेंट के तौर पर दें.

पेजेशन करते समय, models.list के लिए दिए गए सभी अन्य पैरामीटर, उस कॉल से मेल खाने चाहिए जिसने पेज टोकन दिया था.

अनुरोध का मुख्य भाग

अनुरोध का मुख्य हिस्सा खाली होना चाहिए.

अनुरोध का उदाहरण

Python

from google import genai

client = genai.Client()

print("List of models that support generateContent:\n")
for m in client.models.list():
    for action in m.supported_actions:
        if action == "generateContent":
            print(m.name)

print("List of models that support embedContent:\n")
for m in client.models.list():
    for action in m.supported_actions:
        if action == "embedContent":
            print(m.name)

शेल

curl https://generativelanguage.googleapis.com/v1beta/models?key=$GEMINI_API_KEY

जवाब का मुख्य भाग

ListModel से मिला जवाब, जिसमें मॉडल की पेज की गई सूची शामिल है.

अगर एपीआई सही से जुड़ जाता है, ताे जवाब के मुख्य भाग में नीचे दिए गए स्ट्रक्चर शामिल होता है.

फ़ील्ड
models[] object (Model)

लौटाए गए मॉडल.

nextPageToken string

अगला पेज पाने के लिए, pageToken के तौर पर भेजा जा सकने वाला टोकन.

अगर इस फ़ील्ड को छोड़ा जाता है, तो इसका मतलब है कि कोई और पेज नहीं है.

JSON के काेड में दिखाना
{
  "models": [
    {
      object (Model)
    }
  ],
  "nextPageToken": string
}

REST रिसॉर्स: models

संसाधन: मॉडल

जनरेटिव लैंग्वेज मॉडल के बारे में जानकारी.

फ़ील्ड
name string

ज़रूरी है. Model के संसाधन का नाम. इस्तेमाल की जा सकने वाली सभी वैल्यू के लिए, मॉडल के वैरिएंट देखें.

फ़ॉर्मैट: models/{model}, जिसका नाम रखने का तरीका {model} है:

  • "{baseModelId}-{version}"

उदाहरण:

  • models/gemini-1.5-flash-001
baseModelId string

ज़रूरी है. बेस मॉडल का नाम, इसे जनरेशन के अनुरोध में पास करें.

उदाहरण:

  • gemini-1.5-flash
version string

ज़रूरी है. मॉडल का वर्शन नंबर.

यह मेजर वर्शन (1.0 या 1.5) दिखाता है

displayName string

मॉडल का ऐसा नाम जिसे कोई भी व्यक्ति आसानी से पढ़ सकता है. उदाहरण के लिए, "Gemini 1.5 Flash".

नाम में ज़्यादा से ज़्यादा 128 वर्ण हो सकते हैं. साथ ही, इसमें UTF-8 फ़ॉर्मैट वाले किसी भी वर्ण का इस्तेमाल किया जा सकता है.

description string

मॉडल के बारे में कम शब्दों में जानकारी.

inputTokenLimit integer

इस मॉडल के लिए, इनपुट टोकन की ज़्यादा से ज़्यादा संख्या.

outputTokenLimit integer

इस मॉडल के लिए, आउटपुट टोकन की ज़्यादा से ज़्यादा संख्या.

supportedGenerationMethods[] string

मॉडल को जनरेट करने के लिए इस्तेमाल किए जा सकने वाले तरीके.

एपीआई के उस तरीके के नाम, पास्कल केस स्ट्रिंग के तौर पर तय किए जाते हैं, जैसे कि generateMessage और generateContent.

temperature number

इससे आउटपुट में रैंडमिटी को कंट्रोल किया जाता है.

वैल्यू [0.0,maxTemperature] से ज़्यादा हो सकती हैं. ज़्यादा वैल्यू से अलग-अलग जवाब मिलेंगे. वहीं, 0.0 के आस-पास की वैल्यू से आम तौर पर मॉडल से कम चौंकाने वाले जवाब मिलेंगे. इस वैल्यू से पता चलता है कि मॉडल को कॉल करते समय, बैकएंड किस डिफ़ॉल्ट वैल्यू का इस्तेमाल करेगा.

maxTemperature number

इस मॉडल में ज़्यादा से ज़्यादा कितना तापमान इस्तेमाल किया जा सकता है.

topP number

न्यूक्लियस सैंपलिंग के लिए.

न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को शामिल किया जाता है, जिनकी संभावना का योग कम से कम topP होता है. इस वैल्यू से पता चलता है कि मॉडल को कॉल करते समय, बैकएंड किस डिफ़ॉल्ट वैल्यू का इस्तेमाल करेगा.

topK integer

टॉप-k सैंपलिंग के लिए.

टॉप-k सैंपलिंग में, topK सबसे संभावित टोकन के सेट को ध्यान में रखा जाता है. इस वैल्यू से पता चलता है कि मॉडल को कॉल करते समय, बैकएंड किस डिफ़ॉल्ट वैल्यू का इस्तेमाल करेगा. अगर यह पैरामीटर खाली है, तो इसका मतलब है कि मॉडल में टॉप-k सैंपलिंग का इस्तेमाल नहीं किया जाता. साथ ही, जनरेशन पैरामीटर के तौर पर topK का इस्तेमाल नहीं किया जा सकता.

JSON के काेड में दिखाना
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "maxTemperature": number,
  "topP": number,
  "topK": integer
}