پیش‌نمایش زنده‌ی Gemini 3.1 Flash

پیش‌نمایش زنده‌ی Gemini 3.1 Flash، مدل کم‌تأخیر و تبدیل صدا به صدا است که برای دیالوگ‌های بلادرنگ و برنامه‌های هوش مصنوعی مبتنی بر صدا با تشخیص جزئیات صوتی، دقت عددی و آگاهی چندوجهی بهینه شده است.

مستندات

برای پوشش کامل ویژگی‌ها و قابلیت‌ها، از راهنمای Live API دیدن کنید.

پیش‌نمایش زنده‌ی Gemini 3.1

ملک توضیحات
کد مدل gemini-3.1-flash-live-preview
انواع داده پشتیبانی شده را

ورودی‌ها

متن، تصویر، صدا، ویدئو

خروجی

متن و صدا

محدودیت‌های توکن [*]

محدودیت توکن ورودی

۱۳۱,۰۷۲

محدودیت توکن خروجی

۶۵,۵۳۶

قابلیت‌های

تولید صدا

پشتیبانی شده

API دسته‌ای

پشتیبانی نمی‌شود

ذخیره سازی

پشتیبانی نمی‌شود

اجرای کد

پشتیبانی نمی‌شود

جستجوی فایل

پشتیبانی نمی‌شود

فراخوانی تابع

پشتیبانی شده

اتصال به زمین با نقشه‌های گوگل

پشتیبانی نمی‌شود

تولید تصویر

پشتیبانی نمی‌شود

API زنده

پشتیبانی شده

جستجوی اتصال به زمین

پشتیبانی شده

خروجی‌های ساختاریافته

پشتیبانی نمی‌شود

تفکر

پشتیبانی شده

زمینه URL

پشتیبانی نمی‌شود

نسخه
برای جزئیات بیشتر ، الگوهای نسخه مدل را مطالعه کنید.
  • پیش‌نمایش: gemini-3.1-flash-live-preview
آخرین به‌روزرسانی مارس ۲۰۲۶
حد آستانه دانش ژانویه ۲۰۲۵

مهاجرت از Gemini 2.5 Flash Live

پیش‌نمایش زنده‌ی Gemini 3.1 Flash برای دیالوگ‌های بلادرنگ و با تأخیر کم بهینه شده است. هنگام مهاجرت از gemini-2.5-flash-native-audio-preview-12-2025 ، موارد زیر را در نظر بگیرید:

  • رشته مدل : رشته مدل خود را از gemini-2.5-flash-native-audio-preview-12-2025 به gemini-3.1-flash-live-preview به‌روزرسانی کنید.
  • پیکربندی Thinking : Gemini 3.1 به جای thinkingBudget از thinkingLevel (با تنظیماتی مانند minimal ، low ، medium و high ) استفاده می‌کند. پیش‌فرض برای بهینه‌سازی و کمترین تأخیر، minimal است. به Thinking levels and budgets مراجعه کنید.
  • رویدادهای سرور : یک رویداد BidiGenerateContentServerContent اکنون می‌تواند شامل چندین بخش محتوا به طور همزمان باشد (به عنوان مثال، بخش‌های صوتی و متن). کد خود را به‌روزرسانی کنید تا تمام بخش‌ها را در هر رویداد پردازش کند تا از گم شدن محتوا جلوگیری شود.
  • محتوای کلاینت : send_client_content فقط برای ثبت تاریخچه زمینه اولیه پشتیبانی می‌شود (نیاز به تنظیم initial_history_in_client_content در history_config دارد). send_realtime_input برای ارسال به‌روزرسانی‌های متنی در طول مکالمه استفاده کنید. به به‌روزرسانی‌های محتوای افزایشی مراجعه کنید.
  • پوشش نوبت : به طور پیش‌فرض به جای TURN_INCLUDES_ONLY_ACTIVITY روی TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO تنظیم شده است. نوبت مدل اکنون شامل فعالیت صوتی شناسایی شده و تمام فریم‌های ویدیویی است. اگر برنامه شما در حال حاضر جریان ثابتی از فریم‌های ویدیویی ارسال می‌کند، ممکن است بخواهید برنامه خود را طوری به‌روزرسانی کنید که فقط در صورت وجود فعالیت صوتی، فریم‌های ویدیویی را ارسال کند تا از هزینه‌های اضافی جلوگیری شود.
  • فراخوانی تابع ناهمگام : هنوز پشتیبانی نمی‌شود. فراخوانی تابع فقط همزمان است. مدل تا زمانی که پاسخ ابزار را ارسال نکرده باشید، شروع به پاسخگویی نمی‌کند. به فراخوانی تابع ناهمگام مراجعه کنید.
  • صدای فعال و گفتگوی عاطفی : این ویژگی‌ها هنوز در Gemini 3.1 Flash Live پشتیبانی نمی‌شوند. هرگونه پیکربندی برای این ویژگی‌ها را از کد خود حذف کنید. به بخش صدای فعال و گفتگوی عاطفی مراجعه کنید.

برای مقایسه دقیق ویژگی‌ها، به جدول مقایسه مدل‌ها در راهنمای قابلیت‌ها مراجعه کنید.