Gemini 3
Gemini 3.1 Pro
Zaawansowana inteligencja, umiejętność rozwiązywania złożonych problemów oraz zaawansowane możliwości agentowe i vibe coding.
Podgląd
Gemini 3 Flash
Wydajność na poziomie modeli z serii Frontier, ale przy ułamku kosztów.
Podgląd
Gemini 3.1 Flash-Lite
Wydajność na poziomie modeli z serii Frontier, ale przy ułamku kosztów.
Stabilny
Gemini 3.1 Flash-Lite
Wydajność na poziomie modeli z serii Frontier, ale przy ułamku kosztów.
Podgląd
Nano Banana 2
Wydajne generowanie i edytowanie obrazów zoptymalizowane pod kątem szybkości i zastosowań wymagających dużej ilości danych.
Podgląd
Nano Banana Pro
Najnowocześniejsze modele generowania i edytowania obrazów do tworzenia obrazów natywnych o wysokim stopniu kontekstowości.
Podgląd
Gemini 3.1 Flash Live
Wysokiej jakości model Live API o krótkim czasie oczekiwania do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.
Nowy podgląd
Gemini 3.1 Flash TTS
Wydajne generowanie mowy z krótkim czasem oczekiwania.
Nowy podgląd
Gemini 2.5 Flash
Gemini 2.5 Flash
Nasz najlepszy model pod względem stosunku ceny do wydajności do zadań wymagających rozumowania, krótkiego czasu oczekiwania i dużej ilości danych.
Nano Banana
Najnowocześniejsze natywne generowanie i edytowanie obrazów zaprojektowane pod kątem szybkiej pracy twórczej.
Podgląd Gemini 2.5 Flash Live
Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym z natywnym strumieniowaniem dźwięku poniżej sekundy.
Podgląd Gemini 2.5 Flash TTS
Generowanie dźwięku z tekstu z możliwością kontrolowania stylu i tempa.
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite
Najszybszy i najbardziej ekonomiczny model multimodalny z rodziny 2.5.
Gemini 2.5 Pro
Gemini 2.5 Pro
Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.
Podgląd Gemini 2.5 Pro TTS
Synteza mowy o wysokiej jakości zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.
Modele audio
Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach
Podgląd Gemini 3.1 Flash Live
Nasz wysokiej jakości model audio-to-audio (A2A) o krótkim czasie oczekiwania zaprojektowany pod kątem prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.
Podgląd Gemini 3.1 Flash TTS
Wydajne generowanie mowy z krótkim czasem oczekiwania, naturalnymi wynikami, sterowalnymi promptami i nowymi ekspresyjnymi tagami audio do precyzyjnej kontroli narracji.
Podgląd Gemini 2.5 Flash Live
Nasz flagowy model Live API do dwukierunkowych agentów głosowych i wideo o krótkim czasie oczekiwania z natywnym rozumowaniem audio.
Podgląd Gemini 2.5 Flash TTS
Szybkie i sterowalne generowanie mowy z tekstu do aplikacji o krótkim czasie oczekiwania i niskich kosztach oraz asystentów działających w czasie rzeczywistym.
Podgląd Gemini 2.5 Pro TTS
Synteza mowy o wysokiej jakości zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.
Modele generatywne mediów
Ta sekcja zawiera wszystkie modele generatywne mediów, w tym te, które mogą być już wymienione w innych sekcjach
Podgląd Nano Banana 2
Wydajne tworzenie wizualne na dużą skalę, które łączy inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.
Podgląd Veo 3.1
Najnowocześniejsze generowanie filmów kinowych z zaawansowanymi elementami sterującymi i natywnie zsynchronizowanym dźwiękiem.
Podgląd Nano Banana Pro
Profesjonalny silnik projektowy z rdzeniem rozumującym, który umożliwia tworzenie wizualizacji 4K o jakości studyjnej, złożonych układów i precyzyjnego renderowania tekstu.
Podgląd Veo 3.1 Lite
Wydajne, tanie i przyjazne dla deweloperów generowanie i edytowanie filmów oraz sterowanie kinowe z rodziny Veo 3.1.
Nano Banana
Najnowocześniejsze natywne generowanie i edytowanie obrazów zaprojektowane pod kątem szybkiej pracy twórczej.
Imagen 4
Model zamiany tekstu na obraz, który umożliwia szybkie i bardzo szybkie generowanie oraz wyjątkową przejrzystość obrazu w rozdzielczości do 2K.
Modele generowania muzyki
Ta sekcja zawiera wszystkie modele generowania muzyki, w tym te, które mogą być już wymienione w innych sekcjach
Podgląd Lyria 3 Pro
Nasz flagowy model generowania muzyki zoptymalizowany pod kątem pełnych utworów o złożonej spójności strukturalnej.
Podgląd Lyria 3 Clip
Zoptymalizowany pod kątem generowania krótkich klipów muzycznych, pętli i podglądów o długości do 30 sekund.
Lyria RealTime (wersja eksperymentalna)
Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę twórczą i możliwości strumieniowania w czasie rzeczywistym.
Modele narzędzi i agentów
Podgląd korzystania z komputera
Model specjalistyczny, który może „widzieć” ekran cyfrowy i wykonywać działania w interfejsie użytkownika, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.
Podgląd Gemini Deep Research
Model agentowy, który autonomicznie planuje i wykonuje wieloetapowe badania w setkach źródeł, aby tworzyć cytowane, interaktywne raporty.
Podgląd Gemini Deep Research Max
Maksymalna kompleksowość w zakresie automatycznego zbierania i syntezy kontekstu w setkach źródeł.
Modele zadań specjalistycznych
Gemini Embedding 2
Nasz pierwszy model osadzania multimodalnego, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni osadzania na potrzeby zaawansowanego wyszukiwania semantycznego i systemów RAG.
Gemini Embedding
Reprezentacje wektorowe o wysokiej wymiarowości na potrzeby zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.
Podgląd Gemini Robotics-ER 1.6
Zaawansowany model rozumowania ucieleśnionego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla agentów robotycznych z nowymi możliwościami, takimi jak odczytywanie instrumentów oraz ulepszone rozumowanie przestrzenne i fizyczne.
Poprzednie modele
Gemini 2.0 Flash (wycofany)
Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.
Gemini 2.0 Flash-Lite (wycofany)
Nasz najszybszy model drugiej generacji zoptymalizowany pod kątem oszczędności i krótkiego czasu oczekiwania.
Wyłączenie podglądu Gemini 3 Pro
Nasz najnowocześniejszy model rozumowania z zaawansowanym rozpoznawaniem multimodalnym.
Wzorce nazw wersji modelu
Modele Gemini są dostępne w wersjach stabilnych, podglądowych, najnowszych lub eksperymentalnych.
Stabilny
Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.
Na przykład: gemini-2.5-flash.
Podgląd
Wskazuje model podglądowy, który może być używany w środowisku produkcyjnym. Modele podglądowe zwykle mają włączone rozliczenia, mogą mieć bardziej restrykcyjne limity żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.
Na przykład: gemini-2.5-flash-preview-09-2025.
Najnowsze
Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, podglądowa lub eksperymentalna. Ten alias będzie automatycznie zamieniany na każdą nową wersję konkretnego wariantu modelu. Zanim zmienimy wersję, która jest starsza od najnowszej, wyślemy e-maila z 2-tygodniowym wyprzedzeniem.
Na przykład: gemini-flash-latest.
Eksperymentalna
Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity żądań. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.
Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modelu może się zmienić.
Wycofanie modeli
Więcej informacji o wycofywaniu modeli znajdziesz na stronie Wycofanie Gemini.