API تعاملات اکنون به طور عمومی در دسترس است. توصیه می‌کنیم برای دسترسی به جدیدترین ویژگی‌ها و مدل‌ها از این API استفاده کنید.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

مدل ها

این راهنما تمام مدل‌های موجود از طریق رابط برنامه‌نویسی نرم‌افزار Gemini را معرفی می‌کند.

جمینی ۳

پایدار

فلش جمینی ۳.۵

هوشمندترین مدل برای عملکرد مرزی پایدار در وظایف عامل‌دار و کدنویسی.

پایدار

جمینی ۳.۱ فلش-لایت

عملکردی در سطح کلاس Frontier که با کسری از قیمت، مدل‌های بزرگ‌تر را به رقابت می‌خواند.

پایدار

نانو موز ۲

تولید و ویرایش تصویر قدرتمند و با راندمان بالا، بهینه شده برای سرعت و موارد استفاده با حجم بالا.

پایدار

نانو موز ۲ لایت

تولید و ویرایش تصویر با تأخیر بسیار کم و مقرون‌به‌صرفه، طراحی‌شده برای موارد استفاده تعاملی با حجم بالا.

پایدار

نانو موز پرو

مدل‌های پیشرفته تولید و ویرایش تصویر برای خلق تصاویر بومی با بافت بسیار بالا.

پایدار

پیش‌نمایش

جمینی ۳.۱ پرو

هوش پیشرفته، مهارت‌های حل مسئله پیچیده و قابلیت‌های قدرتمند کدنویسی عاملی و ارتعاشی.

پیش‌نمایش

فلش جمینی ۳

عملکردی در سطح کلاس Frontier که با کسری از قیمت، مدل‌های بزرگ‌تر را به رقابت می‌خواند.

پیش‌نمایش

ترجمه زنده جمینی ۳.۵

مدل ترجمه گفتار به گفتار با تأخیر کم و به‌صورت بلادرنگ که از بیش از ۷۰ زبان پشتیبانی می‌کند.

پیش‌نمایش جدید

جمینی ۳.۱ فلش لایو

مدل رابط برنامه‌نویسی کاربردی زنده (Live API) با کیفیت بالا و تأخیر کم برای گفتگوهای بلادرنگ و برنامه‌های هوش مصنوعی مبتنی بر صدا.

پیش‌نمایش جدید

جمینی ۳.۱ فلش TTS

تولید گفتار قدرتمند و با تأخیر کم.

پیش‌نمایش جدید

فلش جمینی اومنی

تولید و ویرایش سریع و محاوره‌ای ویدیو. تبدیل متن و تصاویر به ویدیو و اصلاح نتایج از طریق زبان طبیعی.

پیش‌نمایش جدید

فلش جمینی ۲.۵

بهترین مدل ما از نظر قیمت-عملکرد برای کارهای با تأخیر کم و حجم بالا که نیاز به استدلال دارند.

نانو موز

تولید و ویرایش تصویر بومی پیشرفته که برای گردش‌های کاری سریع و خلاقانه طراحی شده است.

پیش‌نمایش زنده Gemini 2.5 Flash

برای اپراتورهای مکالمه‌ای بلادرنگ با پخش صوتی بومی زیر ثانیه بهینه شده است.

پیش‌نمایش TTS فلش جمینی ۲.۵

تولید صدای متن به گفتار قابل کنترل با کنترل دقیق بر سبک و سرعت.

جمینی ۲.۵ فلش-لایت

سریع‌ترین و مقرون‌به‌صرفه‌ترین مدل چندوجهی در خانواده‌ی ۲.۵.

جمینی ۲.۵ پرو

پیشرفته‌ترین مدل ما برای کارهای پیچیده، با قابلیت‌های استدلال عمیق و کدنویسی.

پیش‌نمایش Gemini 2.5 Pro TTS

سنتز گفتار با دقت بالا، برای کیفیت در گردش‌های کاری ساختاریافته مانند پادکست‌ها و کتاب‌های صوتی بهینه شده است.

مدل‌های صوتی

این بخش شامل تمام مدل‌های صوتی است، از جمله مدل‌هایی که ممکن است از قبل در بخش‌های دیگر فهرست شده باشند.

پیش‌نمایش زنده‌ی Gemini 3.1 Flash

مدل تبدیل صدا به صدا (A2A) با کیفیت بالا و تأخیر کم ما که برای گفتگوی بلادرنگ و برنامه‌های هوش مصنوعی مبتنی بر صدا طراحی شده است.

پیش‌نمایش TTS فلش جمینی ۳.۱

تولید گفتار قدرتمند و با تأخیر کم، با خروجی‌های طبیعی، دستورات قابل هدایت و برچسب‌های صوتی گویای جدید برای کنترل دقیق روایت.

پیش‌نمایش زنده Gemini 2.5 Flash

مدل API زنده‌ی شاخص ما برای عامل‌های صوتی و تصویری دوطرفه با تأخیر کم و استدلال صوتی بومی.

پیش‌نمایش TTS فلش جمینی ۲.۵

تبدیل متن به گفتار سریع و قابل کنترل برای برنامه‌های کاربردی کم‌تاخیر، مقرون‌به‌صرفه و دستیاران بلادرنگ.

مدل‌های رسانه‌ای مولد

این بخش شامل تمام مدل‌های رسانه مولد، از جمله مدل‌هایی است که ممکن است از قبل در بخش‌های دیگر فهرست شده باشند.

نانو موز ۲

خلق تصاویر بصری با راندمان بالا در مقیاس تولید، ترکیبی از هوش سری Gemini 3 با سرعت تولید برق‌آسا.

نانو موز ۲ لایت

به عنوان متخصص بهره‌وری در خانواده تولید تصویر طراحی شده است و تولید و ویرایش تصویر با تأخیر بسیار کم و مقرون به صرفه را ارائه می‌دهد.

پیش‌نمایش ویو ۳.۱

تولید ویدیوی سینمایی پیشرفته با کنترل‌های خلاقانه پیشرفته و صدای هماهنگ‌شده‌ی بومی.

نانو موز پرو

یک موتور طراحی حرفه‌ای با هسته استدلال برای تصاویر 4K با کیفیت استودیویی، طرح‌بندی‌های پیچیده و رندر دقیق متن.

پیش‌نمایش Veo 3.1 Lite

تولید، ویرایش و کنترل سینمایی با راندمان بالا، کم‌هزینه، مختص توسعه‌دهندگان از خانواده Veo 3.1.

پیش‌نمایش فلش جمینی اومنی

تولید و ویرایش سریع و محاوره‌ای ویدیو. تبدیل متن و تصاویر به ویدیو و اصلاح نتایج از طریق زبان طبیعی.

نانو موز

تولید و ویرایش تصویر بومی پیشرفته که برای گردش‌های کاری سریع و خلاقانه طراحی شده است.

ایمیج‌ان ۴ منسوخ شده است

مدل تبدیل متن به تصویر هنوز هم وجود دارد، با قابلیت تولید سریع و فوق‌العاده سریع و وضوح استثنایی تا وضوح 2K.

مدل‌های تولید موسیقی

این بخش شامل تمام مدل‌های تولید موسیقی، از جمله مدل‌هایی است که ممکن است از قبل در بخش‌های دیگر فهرست شده باشند.

پیش‌نمایش Lyria 3 Pro

مدل تولید موسیقی پرچمدار ما، بهینه شده برای آهنگ‌های کامل با انسجام ساختاری پیچیده.

پیش‌نمایش کلیپ لیریا ۳

بهینه شده برای تولید کلیپ‌های کوتاه موسیقی، حلقه‌ها و پیش‌نمایش‌ها تا 30 ثانیه.

لیریا ریل‌تایم اکسپریمنتال

مدل تولید موسیقی با کیفیت بالا که کنترل خلاقانه‌ی جزئی و قابلیت‌های پخش زنده را فراهم می‌کند.

مدل‌های ابزار و عامل

پیش‌نمایش استفاده از کامپیوتر

یک مدل تخصصی که می‌تواند یک صفحه نمایش دیجیتال را «ببیند» و اقدامات رابط کاربری مانند کلیک کردن، تایپ کردن و پیمایش را برای خودکارسازی وظایف پیچیده مرورگر انجام دهد.

پیش‌نمایش تحقیقات عمیق جمینی

یک مدل عامل‌محور که به صورت خودکار تحقیقات چند مرحله‌ای را در صدها منبع برنامه‌ریزی و اجرا می‌کند تا گزارش‌های تعاملی و استناد شده تولید کند.

پیش‌نمایش مکس تحقیقات عمیق جمینی

حداکثر جامعیت برای جمع‌آوری و ترکیب خودکار محتوا از صدها منبع.

پیش‌نمایش عامل ضد جاذبه

یک عامل مدیریت‌شده‌ی همه‌منظوره که به‌طور خودکار برنامه‌ریزی، استدلال، اجرای کد، مدیریت فایل‌ها و مرور وب را در یک سندباکس لینوکس امن و ایزوله انجام می‌دهد.

مدل‌های وظیفه تخصصی

جاسازی جمینی ۲

اولین مدل جاسازی چندوجهی ما، نگاشت متن، تصاویر، ویدیو، صدا و فایل‌های PDF به یک فضای جاسازی یکپارچه برای جستجوی معنایی پیشرفته و سیستم‌های RAG.

جاسازی جمینی

نمایش‌های برداری با ابعاد بالا برای جستجوی معنایی پیشرفته، طبقه‌بندی متن و سیستم‌های RAG

پیش‌نمایش Gemini Robotics-ER 1.6

مدل استدلال تجسمی پیشرفته که فضاهای فیزیکی را درک می‌کند و وظایف چند مرحله‌ای را برای عوامل رباتیک با قابلیت‌های جدید مانند خواندن ابزار و استدلال فضایی و فیزیکی بهبود یافته برنامه‌ریزی می‌کند.

مدل‌های قبلی

خاموش کردن فلش Gemini 2.0

مدل نسل دوم و قدرتمند ما، با ویژگی‌های نسل بعدی و قابلیت‌های بهبود یافته، از جمله سرعت برتر، استفاده از ابزار بومی و یک پنجره زمینه توکن ۱ میلیونی.

خاموش شدن Gemini 2.0 Flash-Lite

سریع‌ترین مدل نسل دوم ما، بهینه شده برای بهره‌وری هزینه و تأخیر کم.

پیش‌نمایش Gemini 3.1 Flash-Lite خاموش شدن

مقرون به صرفه‌ترین مدل چندوجهی ما، که سریع‌ترین عملکرد را برای کارهای سبک و با فرکانس بالا ارائه می‌دهد.

پیش‌نمایش جمینی ۳ پرو، خاموش شدن

مدل استدلال پیشرفته ما، با درک چندوجهی پیشرفته.

الگوهای نام نسخه مدل

مدل‌های Gemini در نسخه‌های پایدار ، پیش‌نمایش ، جدیدترین یا آزمایشی موجود هستند.

پایدار

به یک مدل پایدار خاص اشاره می‌کند. مدل‌های پایدار معمولاً تغییر نمی‌کنند. اکثر برنامه‌های کاربردی باید از یک مدل پایدار خاص استفاده کنند.

برای مثال: gemini-3.5-flash .

پیش‌نمایش

به یک مدل پیش‌نمایش اشاره می‌کند که ممکن است برای تولید استفاده شود. مدل‌های پیش‌نمایش معمولاً قابلیت پرداخت صورتحساب را دارند، ممکن است محدودیت‌های نرخ محدودتری داشته باشند و با حداقل ۲ هفته اطلاع قبلی منسوخ می‌شوند.

برای مثال: gemini-2.5-flash-preview-09-2025 .

جدیدترین‌ها

به آخرین نسخه برای یک مدل خاص اشاره می‌کند. این می‌تواند یک نسخه پایدار، پیش‌نمایش یا آزمایشی باشد. این نام مستعار با هر نسخه جدید از یک مدل خاص، به صورت خودکار تغییر می‌کند. قبل از تغییر نسخه قبلی، یک اطلاع‌رسانی دو هفته‌ای از طریق ایمیل انجام خواهد شد.

برای مثال: gemini-flash-latest .

تجربی

به یک مدل آزمایشی اشاره دارد که معمولاً برای استفاده در محیط عملیاتی مناسب نیست و محدودیت‌های نرخ بیشتری دارد. ما مدل‌های آزمایشی را منتشر می‌کنیم تا بازخوردها را جمع‌آوری کنیم و آخرین به‌روزرسانی‌های خود را به سرعت در اختیار توسعه‌دهندگان قرار دهیم.

مدل‌های تجربی پایدار نیستند و در دسترس بودن نقاط پایانی مدل ممکن است تغییر کند.

منسوخ شدن مدل‌ها

برای اطلاعات بیشتر در مورد منسوخ شدن مدل‌ها، به صفحه منسوخ شدن Gemini مراجعه کنید.