Gemini 2.0 Flash Thinking

מודל Gemini 2.0 Flash Thinking הוא מודל ניסיוני שמאומן ליצור את 'תהליך החשיבה' שבו המודל עובר כחלק מהתגובה שלו. כתוצאה מכך, מודל החשיבה המהירה מסוגל לספק תשובות עם יכולות הסקת מסקנות טובות יותר מאשר מודל Gemini 2.0 Flash Experimental.

שימוש במודלים של חשיבה

מודלים של חשיבה מהירה זמינים ב-Google AI Studio דרך Gemini API. ה-API של Gemini לא מחזיר מחשבות בתגובה.

שליחת בקשה בסיסית

Python

בדוגמה הזו נעשה שימוש ב-Google Genai SDK החדש ובגרסה v1alpha של ה-API.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

שיחות מחשבה עם מספר תורנים

במהלך שיחות עם כמה תורנויות, המחשבות מהתורנויות הקודמות מוחרגות מהקלט של המודל.

Python

Google Genai SDK החדש מאפשר ליצור סשן צ'אט עם כמה תורנים, שעוזר לנהל את מצב השיחה.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

מגבלות

מודל Flash Thinking הוא מודל ניסיוני, והוא כולל את המגבלות הבאות:

  • ללא מצב JSON או Search Grounding
  • התובנות מוצגות רק ב-Google AI Studio

מה השלב הבא?