API تعاملات اکنون به طور عمومی در دسترس است. توصیه می‌کنیم برای دسترسی به جدیدترین ویژگی‌ها و مدل‌ها از این API استفاده کنید.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

پیش‌نمایش زنده‌ی Gemini 3.1 Flash

پیش‌نمایش زنده‌ی Gemini 3.1 Flash، مدل کم‌تأخیر و تبدیل صدا به صدا است که برای دیالوگ‌های بلادرنگ و برنامه‌های هوش مصنوعی مبتنی بر صدا با تشخیص جزئیات صوتی، دقت عددی و آگاهی چندوجهی بهینه شده است.

در استودیوی هوش مصنوعی گوگل امتحان کنید

مستندات

برای پوشش کامل ویژگی‌ها و قابلیت‌ها، از راهنمای Live API دیدن کنید.

پیش‌نمایش زنده‌ی Gemini 3.1

ملک	توضیحات
کد مدل	`gemini-3.1-flash-live-preview`
انواع داده پشتیبانی شده را	ورودی‌ها متن، تصویر، صدا، ویدئو خروجی متن و صدا
محدودیت‌های توکن ^[*]	محدودیت توکن ورودی ۱۳۱,۰۷۲ محدودیت توکن خروجی ۶۵,۵۳۶
قابلیت‌های	تولید صدا پشتیبانی شده ذخیره سازی پشتیبانی نمی‌شود اجرای کد پشتیبانی نمی‌شود جستجوی فایل پشتیبانی نمی‌شود فراخوانی تابع پشتیبانی شده اتصال به زمین با نقشه‌های گوگل پشتیبانی نمی‌شود تولید تصویر پشتیبانی نمی‌شود API زنده پشتیبانی شده جستجوی اتصال به زمین پشتیبانی شده خروجی‌های ساختاریافته پشتیبانی نمی‌شود تفکر پشتیبانی شده زمینه URL پشتیبانی نمی‌شود
گزینه‌های مصرف	API دسته‌ای پشتیبانی نمی‌شود
نسخه	برای جزئیات بیشتر ، الگوهای نسخه مدل را مطالعه کنید. پیش‌نمایش: `gemini-3.1-flash-live-preview`
آخرین به‌روزرسانی	مارس ۲۰۲۶
حد آستانه دانش	ژانویه ۲۰۲۵

مهاجرت از Gemini 2.5 Flash Live

پیش‌نمایش زنده‌ی Gemini 3.1 Flash برای دیالوگ‌های بلادرنگ و با تأخیر کم بهینه شده است. هنگام مهاجرت از gemini-2.5-flash-native-audio-preview-12-2025 ، موارد زیر را در نظر بگیرید:

رشته مدل : رشته مدل خود را از gemini-2.5-flash-native-audio-preview-12-2025 به gemini-3.1-flash-live-preview به‌روزرسانی کنید.
پیکربندی Thinking : Gemini 3.1 به جای thinkingBudget از thinkingLevel (با تنظیماتی مانند minimal ، low ، medium و high ) استفاده می‌کند. پیش‌فرض برای بهینه‌سازی و کمترین تأخیر، minimal است. به Thinking levels and budgets مراجعه کنید.
رویدادهای سرور : یک رویداد BidiGenerateContentServerContent اکنون می‌تواند شامل چندین بخش محتوا به طور همزمان باشد (به عنوان مثال، بخش‌های صوتی و متن). کد خود را به‌روزرسانی کنید تا تمام بخش‌ها را در هر رویداد پردازش کند تا از گم شدن محتوا جلوگیری شود.
محتوای کلاینت : send_client_content فقط برای ثبت تاریخچه زمینه اولیه پشتیبانی می‌شود (نیاز به تنظیم initial_history_in_client_content در history_config دارد). send_realtime_input برای ارسال به‌روزرسانی‌های متنی در طول مکالمه استفاده کنید. به به‌روزرسانی‌های محتوای افزایشی مراجعه کنید.
پوشش نوبت : به طور پیش‌فرض به جای TURN_INCLUDES_ONLY_ACTIVITY روی TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO تنظیم شده است. نوبت مدل اکنون شامل فعالیت صوتی شناسایی شده و تمام فریم‌های ویدیویی است. اگر برنامه شما در حال حاضر جریان ثابتی از فریم‌های ویدیویی ارسال می‌کند، ممکن است بخواهید برنامه خود را طوری به‌روزرسانی کنید که فقط در صورت وجود فعالیت صوتی، فریم‌های ویدیویی را ارسال کند تا از هزینه‌های اضافی جلوگیری شود.
فراخوانی تابع ناهمگام : هنوز پشتیبانی نمی‌شود. فراخوانی تابع فقط همزمان است. مدل تا زمانی که پاسخ ابزار را ارسال نکرده باشید، شروع به پاسخگویی نمی‌کند. به فراخوانی تابع ناهمگام مراجعه کنید.
صدای فعال و گفتگوی عاطفی : این ویژگی‌ها هنوز در Gemini 3.1 Flash Live پشتیبانی نمی‌شوند. هرگونه پیکربندی برای این ویژگی‌ها را از کد خود حذف کنید. به بخش صدای فعال و گفتگوی عاطفی مراجعه کنید.

برای مقایسه دقیق ویژگی‌ها، به جدول مقایسه مدل‌ها در راهنمای قابلیت‌ها مراجعه کنید.