جمینی ۳
جمینی ۳ پرو
هوشمندترین مدل ما، بهترین مدل در جهان برای درک چندوجهی، که همگی بر اساس استدلال پیشرفته ساخته شدهاند.
پیشنمایش
هوشمندترین مدل ما، بهترین مدل در جهان برای درک چندوجهی، که همگی بر اساس استدلال پیشرفته ساخته شدهاند.
پیشنمایش
عملکردی در سطح کلاس Frontier که با کسری از قیمت، مدلهای بزرگتر را به رقابت میخواند.
پیشنمایش
مدلهای پیشرفته تولید و ویرایش تصویر برای خلق تصاویر بومی با بافت بسیار بالا.
پیشنمایش
بهترین مدل ما از نظر قیمت-عملکرد برای کارهای با تأخیر کم و حجم بالا که نیاز به استدلال دارند.
تولید و ویرایش تصویر بومی پیشرفته که برای گردشهای کاری سریع و خلاقانه طراحی شده است.
برای اپراتورهای مکالمهای بلادرنگ با پخش صوتی بومی زیر ثانیه بهینه شده است.
تولید صدای متن به گفتار قابل کنترل با کنترل دقیق بر سبک و سرعت.
سریعترین و مقرونبهصرفهترین مدل چندوجهی در خانوادهی ۲.۵.
پیشرفتهترین مدل ما برای کارهای پیچیده، با قابلیتهای استدلال عمیق و کدنویسی.
سنتز گفتار با دقت بالا، برای کیفیت در گردشهای کاری ساختاریافته مانند پادکستها و کتابهای صوتی بهینه شده است.
این بخش شامل تمام مدلهای صوتی است، از جمله مدلهایی که ممکن است از قبل در بخشهای دیگر فهرست شده باشند.
مدل API زندهی شاخص ما برای عاملهای صوتی و تصویری دوطرفه با تأخیر کم و استدلال صوتی بومی.
تبدیل متن به گفتار سریع و قابل کنترل برای برنامههای کاربردی کمتاخیر، مقرونبهصرفه و دستیاران بلادرنگ.
سنتز گفتار با دقت بالا، برای کیفیت در گردشهای کاری ساختاریافته مانند پادکستها و کتابهای صوتی بهینه شده است.
مدل تولید موسیقی با کیفیت بالا که کنترل خلاقانه دقیقی بر سازها، BPM و آهنگهای پیچیده ارائه میدهد.
این بخش شامل تمام مدلهای رسانه مولد، از جمله مدلهایی است که ممکن است از قبل در بخشهای دیگر فهرست شده باشند.
تولید ویدیوی سینمایی پیشرفته با کنترلهای خلاقانه پیشرفته و صدای هماهنگشدهی بومی.
یک موتور طراحی حرفهای با هسته استدلال برای تصاویر 4K با کیفیت استودیویی، طرحبندیهای پیچیده و رندر دقیق متن.
تولید و ویرایش تصویر بومی پیشرفته که برای گردشهای کاری سریع و خلاقانه طراحی شده است.
مدل تولید موسیقی با کیفیت بالا که کنترل خلاقانه دقیقی بر سازها، BPM و آهنگهای پیچیده ارائه میدهد.
مدل تبدیل متن به تصویر هنوز هم وجود دارد، با قابلیت تولید سریع و فوقالعاده سریع و وضوح استثنایی تا وضوح 2K.
یک مدل تخصصی که میتواند یک صفحه نمایش دیجیتال را «ببیند» و اقدامات رابط کاربری مانند کلیک کردن، تایپ کردن و پیمایش را برای خودکارسازی وظایف پیچیده مرورگر انجام دهد.
یک مدل عاملمحور که به صورت خودکار تحقیقات چند مرحلهای را در صدها منبع برنامهریزی و اجرا میکند تا گزارشهای تعاملی و استناد شده تولید کند.
نمایشهای برداری با ابعاد بالا برای جستجوی معنایی پیشرفته، طبقهبندی متن و سیستمهای RAG
مدل استدلال تجسمی پیشرفته که فضاهای فیزیکی را درک میکند و وظایف چند مرحلهای را برای عوامل رباتیک برنامهریزی میکند.
مدل نسل دوم و قدرتمند ما، با ویژگیهای نسل بعدی و قابلیتهای بهبود یافته، از جمله سرعت برتر، استفاده از ابزار بومی و یک پنجره زمینه توکن ۱ میلیونی.
سریعترین مدل نسل دوم ما، بهینه شده برای بهرهوری هزینه و تأخیر کم.
مدلهای Gemini در نسخههای پایدار ، پیشنمایش ، جدیدترین یا آزمایشی موجود هستند.
به یک مدل پایدار خاص اشاره میکند. مدلهای پایدار معمولاً تغییر نمیکنند. اکثر برنامههای کاربردی باید از یک مدل پایدار خاص استفاده کنند.
برای مثال: gemini-2.5-flash .
به یک مدل پیشنمایش اشاره میکند که ممکن است برای تولید استفاده شود. مدلهای پیشنمایش معمولاً قابلیت پرداخت صورتحساب را دارند، ممکن است محدودیتهای نرخ محدودتری داشته باشند و با حداقل ۲ هفته اطلاع قبلی منسوخ میشوند.
برای مثال: gemini-2.5-flash-preview-09-2025 .
به آخرین نسخه برای یک مدل خاص اشاره میکند. این میتواند یک نسخه پایدار، پیشنمایش یا آزمایشی باشد. این نام مستعار با هر نسخه جدید از یک مدل خاص، به صورت خودکار تغییر میکند. قبل از تغییر نسخه قبلی، یک اطلاعرسانی دو هفتهای از طریق ایمیل انجام خواهد شد.
برای مثال: gemini-flash-latest .
به یک مدل آزمایشی اشاره دارد که معمولاً برای استفاده در محیط عملیاتی مناسب نیست و محدودیتهای نرخ بیشتری دارد. ما مدلهای آزمایشی را منتشر میکنیم تا بازخوردها را جمعآوری کنیم و آخرین بهروزرسانیهای خود را به سرعت در اختیار توسعهدهندگان قرار دهیم.
مدلهای تجربی پایدار نیستند و در دسترس بودن نقاط پایانی مدل ممکن است تغییر کند.
برای اطلاعات بیشتر در مورد منسوخ شدن مدلها، به صفحه منسوخ شدن Gemini مراجعه کنید.
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2026-02-18 بهوقت ساعت هماهنگ جهانی.