پیشنمایش زندهی Gemini 3.1 Flash، مدل کمتأخیر و تبدیل صدا به صدا است که برای دیالوگهای بلادرنگ و برنامههای هوش مصنوعی مبتنی بر صدا با تشخیص جزئیات صوتی، دقت عددی و آگاهی چندوجهی بهینه شده است.
مستندات
برای پوشش کامل ویژگیها و قابلیتها، از راهنمای Live API دیدن کنید.
پیشنمایش زندهی Gemini 3.1
| ملک | توضیحات |
|---|---|
| کد مدل | gemini-3.1-flash-live-preview |
| انواع داده پشتیبانی شده را | ورودیها متن، تصویر، صدا، ویدئو خروجی متن و صدا |
| محدودیتهای توکن [*] | محدودیت توکن ورودی ۱۳۱,۰۷۲ محدودیت توکن خروجی ۶۵,۵۳۶ |
| قابلیتهای | تولید صدا پشتیبانی شده API دستهای پشتیبانی نمیشود ذخیره سازی پشتیبانی نمیشود اجرای کد پشتیبانی نمیشود جستجوی فایل پشتیبانی نمیشود فراخوانی تابع پشتیبانی شده اتصال به زمین با نقشههای گوگل پشتیبانی نمیشود تولید تصویر پشتیبانی نمیشود API زنده پشتیبانی شده جستجوی اتصال به زمین پشتیبانی شده خروجیهای ساختاریافته پشتیبانی نمیشود تفکر پشتیبانی شده زمینه URL پشتیبانی نمیشود |
| نسخه |
|
| آخرین بهروزرسانی | مارس ۲۰۲۶ |
| حد آستانه دانش | ژانویه ۲۰۲۵ |
مهاجرت از Gemini 2.5 Flash Live
پیشنمایش زندهی Gemini 3.1 Flash برای دیالوگهای بلادرنگ و با تأخیر کم بهینه شده است. هنگام مهاجرت از gemini-2.5-flash-native-audio-preview-12-2025 ، موارد زیر را در نظر بگیرید:
- رشته مدل : رشته مدل خود را از
gemini-2.5-flash-native-audio-preview-12-2025بهgemini-3.1-flash-live-previewبهروزرسانی کنید. - پیکربندی Thinking : Gemini 3.1 به جای
thinkingBudgetازthinkingLevel(با تنظیماتی مانندminimal،low،mediumوhigh) استفاده میکند. پیشفرض برای بهینهسازی و کمترین تأخیر،minimalاست. به Thinking levels and budgets مراجعه کنید. - رویدادهای سرور : یک رویداد
BidiGenerateContentServerContentاکنون میتواند شامل چندین بخش محتوا به طور همزمان باشد (به عنوان مثال، بخشهای صوتی و متن). کد خود را بهروزرسانی کنید تا تمام بخشها را در هر رویداد پردازش کند تا از گم شدن محتوا جلوگیری شود. - محتوای کلاینت :
send_client_contentفقط برای ثبت تاریخچه زمینه اولیه پشتیبانی میشود (نیاز به تنظیمinitial_history_in_client_contentدرhistory_configدارد).send_realtime_inputبرای ارسال بهروزرسانیهای متنی در طول مکالمه استفاده کنید. به بهروزرسانیهای محتوای افزایشی مراجعه کنید. - پوشش نوبت : به طور پیشفرض به جای
TURN_INCLUDES_ONLY_ACTIVITYرویTURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOتنظیم شده است. نوبت مدل اکنون شامل فعالیت صوتی شناسایی شده و تمام فریمهای ویدیویی است. اگر برنامه شما در حال حاضر جریان ثابتی از فریمهای ویدیویی ارسال میکند، ممکن است بخواهید برنامه خود را طوری بهروزرسانی کنید که فقط در صورت وجود فعالیت صوتی، فریمهای ویدیویی را ارسال کند تا از هزینههای اضافی جلوگیری شود. - فراخوانی تابع ناهمگام : هنوز پشتیبانی نمیشود. فراخوانی تابع فقط همزمان است. مدل تا زمانی که پاسخ ابزار را ارسال نکرده باشید، شروع به پاسخگویی نمیکند. به فراخوانی تابع ناهمگام مراجعه کنید.
- صدای فعال و گفتگوی عاطفی : این ویژگیها هنوز در Gemini 3.1 Flash Live پشتیبانی نمیشوند. هرگونه پیکربندی برای این ویژگیها را از کد خود حذف کنید. به بخش صدای فعال و گفتگوی عاطفی مراجعه کنید.
برای مقایسه دقیق ویژگیها، به جدول مقایسه مدلها در راهنمای قابلیتها مراجعه کنید.