Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite, कम समय में जवाब देने वाला और किफ़ायती मल्टीमॉडल है. इसे ज़्यादा फ़्रीक्वेंसी वाले और कम डेटा वाले टास्क के लिए ऑप्टिमाइज़ किया गया है. यह मॉडल, टेक्स्ट, इमेज, वीडियो, ऑडियो, और PDF इनपुट के साथ काम करता है. इसे एजेंट के तौर पर काम करने वाले वर्कफ़्लो, डेटा निकालने, और उन ऐप्लिकेशन के लिए डिज़ाइन किया गया है जहां लेटेन्सी और एपीआई की लागत मुख्य समस्याएं हैं.

gemini-3.1-flash-lite

प्रॉपर्टी ब्यौरा
मॉडल कोड gemini-3.1-flash-lite
के साथ इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट, इमेज, वीडियो, ऑडियो, और PDF

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

65,536

सुविधाएँ

ऑडियो जनरेट करने की सुविधा

काम नहीं करता है

कैश मेमोरी में सेव होना

काम करता है

कोड एक्ज़ीक्यूट करना

काम करता है

कंप्यूटर का इस्तेमाल

काम नहीं करता है

फ़ाइल खोजना

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

Google Maps की मदद से जवाब तैयार करना

काम करता है

इमेज जनरेट करने की सुविधा

काम नहीं करता है

Live API

काम नहीं करता है

भरोसेमंद स्रोतों से जानकारी लेना

काम करता है

स्ट्रक्चर्ड आउटपुट

काम करता है

सोचना

काम करता है

यूआरएल का कॉन्टेक्स्ट

काम करता है

कॉन्टेंट देखने के विकल्प

Batch API

काम करता है

फ़्लेक्स अनुमान

काम करता है

प्राथमिकता का अनुमान लगाना

काम करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल वर्शन के पैटर्न पढ़ें.
  • Stable: gemini-3.1-flash-lite
नया अपडेट मई 2026
नॉलेज कटऑफ़ जनवरी 2025

डेवलपर गाइड

Gemini 3.1 Flash-Lite, सामान्य टास्क को बड़े पैमाने पर हैंडल करने के लिए सबसे अच्छा मॉडल है. यहां Gemini 3.1 Flash-Lite के इस्तेमाल के कुछ उदाहरण दिए गए हैं:

  • अनुवाद: बड़े पैमाने पर तेज़ी से और कम लागत में अनुवाद करना. जैसे, बड़े पैमाने पर चैट मैसेज, समीक्षाएं, और सहायता टिकट प्रोसेस करना. सिस्टम के निर्देशों का इस्तेमाल करके, जवाब को सिर्फ़ अनुवाद किए गए टेक्स्ट तक सीमित किया जा सकता है. इसमें कोई अतिरिक्त टिप्पणी शामिल नहीं होगी:

    from google import genai
    
    client = genai.Client()
    text = "Hey, are you down to grab some pizza later? I'm starving!"
    
    response = client.models.generate_content(
        model="gemini-3.1-flash-lite",
        config={
            "system_instruction": "Only output the translated text"
        },
        contents=f"Translate the following text to German: {text}"
    )
    
    print(response.text)
    
  • ट्रांसक्रिप्शन: रिकॉर्डिंग, ऑडियो नोट या किसी भी ऑडियो कॉन्टेंट को प्रोसेस करें. इससे आपको टेक्स्ट ट्रांसक्रिप्ट मिलती है. इसके लिए, आपको स्पीच-टू-टेक्स्ट की अलग पाइपलाइन शुरू करने की ज़रूरत नहीं होती. इसमें मल्टीमॉडल इनपुट का इस्तेमाल किया जा सकता है. इसलिए, ट्रांसक्रिप्शन के लिए सीधे तौर पर ऑडियो फ़ाइलें पास की जा सकती हैं:

    from google import genai
    
    client = genai.Client()
    
    # URL = "https://storage.googleapis.com/generativeai-downloads/data/State_of_the_Union_Address_30_January_1961.mp3"
    # Upload the audio file to the GenAI File API
    uploaded_file = client.files.upload(file='sample.mp3')
    
    prompt = 'Generate a transcript of the audio.'
    
    response = client.models.generate_content(
      model="gemini-3.1-flash-lite",
      contents=[prompt, uploaded_file]
    )
    
    print(response.text)
    
  • लाइटवेट एजेंटिक टास्क और डेटा निकालने की सुविधा: इसमें स्ट्रक्चर्ड JSON आउटपुट के साथ, इकाई का पता लगाना, क्लासिफ़िकेशन, और लाइटवेट डेटा प्रोसेसिंग पाइपलाइन की सुविधा मिलती है. उदाहरण के लिए, ई-कॉमर्स प्लैटफ़ॉर्म पर खरीदार की समीक्षा से स्ट्रक्चर्ड डेटा निकालना:

    from google import genai
    from pydantic import BaseModel, Field
    
    client = genai.Client()
    
    prompt = "Analyze the user review and determine the aspect, sentiment score, summary quote, and return risk"
    input_text = "The boots look amazing and the leather is high quality, but they run way too small. I'm sending them back."
    
    class ReviewAnalysis(BaseModel):
        aspect: str = Field(description="The feature mentioned (e.g., Price, Comfort, Style, Shipping)")
        summary_quote: str = Field(description="The specific phrase from the review about this aspect")
        sentiment_score: int = Field(description="1 to 5 (1=worst, 5=best)")
        is_return_risk: bool = Field(description="True if the user mentions returning the item")
    
    response = client.models.generate_content(
        model="gemini-3.1-flash-lite",
        contents=[prompt, input_text],
        config={
            "response_mime_type": "application/json",
            "response_json_schema": ReviewAnalysis.model_json_schema(),
        },
    )
    
    print(response.text)
    
  • दस्तावेज़ प्रोसेस करना और खास जानकारी देना: PDF फ़ाइलों को पार्स करना और कम शब्दों में खास जानकारी देना. जैसे, दस्तावेज़ प्रोसेस करने की पाइपलाइन बनाना या आने वाली फ़ाइलों को तुरंत प्राथमिकता देना:

    from google import genai
    from google.genai import types
    import httpx
    
    client = genai.Client()
    
    # Download a sample PDF document
    doc_url = "https://storage.googleapis.com/generativeai-downloads/data/med_gemini.pdf"
    doc_data = httpx.get(doc_url).content
    
    prompt = "Summarize this document"
    response = client.models.generate_content(
        model="gemini-3.1-flash-lite",
        contents=[
            types.Part.from_bytes(
                data=doc_data,
                mime_type='application/pdf',
            ),
            prompt
        ]
    )
    
    print(response.text)
    
  • मॉडल राउटिंग: कम समय में जवाब देने वाले और कम लागत वाले मॉडल का इस्तेमाल क्लासिफ़ायर के तौर पर करें. यह मॉडल, टास्क की जटिलता के आधार पर क्वेरी को सही मॉडल पर राउट करता है. यह प्रोडक्शन में इस्तेमाल होने वाला एक असली पैटर्न है. ओपन-सोर्स Gemini CLI, टास्क की मुश्किल को कैटगरी में बांटने के लिए Flash-Lite का इस्तेमाल करता है. इसके बाद, टास्क को Flash या Pro पर भेजता है.

    from google import genai
    
    client = genai.Client()
    
    FLASH_MODEL = 'flash'
    PRO_MODEL = 'pro'
    
    CLASSIFIER_SYSTEM_PROMPT = f"""
    You are a specialized Task Routing AI. Your sole function is to analyze the user's request and classify its complexity. Choose between `{FLASH_MODEL}` (SIMPLE) or `{PRO_MODEL}` (COMPLEX).
    1.  `{FLASH_MODEL}`: A fast, efficient model for simple, well-defined tasks.
    2.  `{PRO_MODEL}`: A powerful, advanced model for complex, open-ended, or multi-step tasks.
    
    A task is COMPLEX if it meets ONE OR MORE of the following criteria:
    1.  High Operational Complexity (Est. 4+ Steps/Tool Calls)
    2.  Strategic Planning and Conceptual Design
    3.  High Ambiguity or Large Scope
    4.  Deep Debugging and Root Cause Analysis
    
    A task is SIMPLE if it is highly specific, bounded, and has Low Operational Complexity (Est. 1-3 tool calls).
    """
    
    user_input = "I'm getting an error 'Cannot read property 'map' of undefined' when I click the save button. Can you fix it?"
    
    response_schema = {
      "type": "object",
      "properties": {
        "reasoning": {
          "type": "string",
          "description": "A brief, step-by-step explanation for the model choice, referencing the rubric."
        },
        "model_choice": {
          "type": "string",
          "enum": [FLASH_MODEL, PRO_MODEL]
        }
      },
      "required": ["reasoning", "model_choice"]
    }
    
    response = client.models.generate_content(
        model="gemini-3.1-flash-lite",
        contents=user_input,
        config={
            "system_instruction": CLASSIFIER_SYSTEM_PROMPT,
            "response_mime_type": "application/json",
            "response_json_schema": response_schema
        },
    )
    
    print(response.text)
    
  • सोचना: ऐसे टास्क के लिए, जिनमें सिलसिलेवार तरीके से तर्क करने से बेहतर नतीजे मिलते हैं, सोचने की सुविधा को कॉन्फ़िगर करें. इससे मॉडल, फ़ाइनल आउटपुट देने से पहले, तर्क करने के लिए ज़्यादा कंप्यूटिंग पावर का इस्तेमाल करेगा:

    from google import genai
    from google.genai import types
    
    client = genai.Client()
    
    response = client.models.generate_content(
        model="gemini-3.1-flash-lite",
        contents="How does AI work?",
        config=types.GenerateContentConfig(
            thinking_config=types.ThinkingConfig(thinking_level="high")
        ),
    )
    
    print(response.text)