Gemini 3
Stabilny
Gemini 3.5 Flash
Najinteligentniejszy model zapewniający stałą, przełomową wydajność w przypadku zadań związanych z agentami i kodowaniem.
Stabilny
Gemini 3.1 Flash-Lite
Wydajność klasy przełomowej, która dorównuje większym modelom, ale przy ułamku kosztów.
Stabilny
Nano Banana 2
Wydajne generowanie i edytowanie obrazów o wysokiej jakości, zoptymalizowane pod kątem szybkości i zastosowań wymagających dużej ilości danych.
Stabilny
Nano Banana Lite
Generowanie i edytowanie obrazów z bardzo małym opóźnieniem i niskimi kosztami, zaprojektowane pod kątem zastosowań interaktywnych wymagających dużej ilości danych.
Stabilny
Nano Banana Pro
Najnowocześniejsze modele do generowania i edytowania obrazów, które umożliwiają tworzenie obrazów natywnych o wysokim stopniu kontekstowości.
Stabilny
Wersja testowa
Gemini 3.1 Pro
Zaawansowana inteligencja, umiejętności rozwiązywania złożonych problemów oraz zaawansowane możliwości kodowania agentów i vibe codingu.
Wersja testowa
Gemini 3 Flash
Wydajność klasy przełomowej, która dorównuje większym modelom, ale przy ułamku kosztów.
Wersja testowa
Gemini 3.5 Live Translate
Model tłumaczenia mowy na mowę w czasie rzeczywistym z krótkim czasem oczekiwania, który obsługuje ponad 70 języków.
Nowa wersja testowa
Gemini 3.1 Flash Live
Wysokiej jakości model Live API z krótkim czasem oczekiwania do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.
Nowa wersja testowa
Gemini 3.1 Flash TTS
Wydajne generowanie mowy z krótkim czasem oczekiwania.
Nowa wersja testowa
Gemini Omni Flash
Szybkie, konwersacyjne generowanie i edytowanie filmów. Przekształcaj tekst i obrazy w filmy oraz dopracowuj wyniki za pomocą języka naturalnego.
Nowa wersja testowa
Gemini 2.5 Flash
Gemini 2.5 Flash
Nasz najlepszy model pod względem stosunku ceny do wydajności w przypadku zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą ilością danych.
Nano Banana
Najnowocześniejsze generowanie i edytowanie obrazów natywnych, które umożliwia szybką pracę twórczą.
Gemini 2.5 Flash Live (wersja testowa)
Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym, którzy przesyłają strumieniowo natywny dźwięk w czasie krótszym niż sekunda.
Gemini 2.5 Flash TTS (wersja testowa)
Generowanie dźwięku za pomocą funkcji zamiany tekstu na mowę z możliwością kontrolowania stylu i tempa.
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite
Najszybszy i najbardziej ekonomiczny model multimodalny z rodziny 2.5.
Gemini 2.5 Pro
Gemini 2.5 Pro
Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.
Gemini 2.5 Pro TTS (wersja testowa)
Synteza mowy o wysokiej jakości, zoptymalizowana pod kątem jakości w przypadku uporządkowanych przepływów pracy, takich jak podcasty i audiobooki.
Modele audio
Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach
Gemini 3.1 Flash Live wersja testowa
Nasz model audio-to-audio (A2A) o wysokiej jakości i krótkim czasie oczekiwania, który jest przeznaczony do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.
Gemini 3.1 Flash TTS (wersja testowa)
Wydajne generowanie mowy z krótkim czasem oczekiwania, naturalnymi wynikami, sterowalnymi promptami i nowymi ekspresyjnymi tagami audio, które umożliwiają precyzyjną kontrolę nad narracją.
Gemini 2.5 Flash Live (wersja testowa)
Nasz flagowy model Live API do dwukierunkowych agentów głosowych i wideo z krótkim czasem oczekiwania oraz natywnym rozumowaniem audio.
Gemini 2.5 Flash TTS (wersja testowa)
Szybka i sterowalna funkcja zamiany tekstu na mowę do aplikacji z krótkim czasem oczekiwania i niskimi kosztami oraz asystentów działających w czasie rzeczywistym.
Gemini 2.5 Pro TTS (wersja testowa)
Synteza mowy o wysokiej jakości, zoptymalizowana pod kątem jakości w przypadku uporządkowanych przepływów pracy, takich jak podcasty i audiobooki.
Generatywne modele multimedialne
Ta sekcja zawiera wszystkie generatywne modele multimedialne, w tym te, które mogą być już wymienione w innych sekcjach
Nano Banana 2
Wydajne tworzenie wizualne na dużą skalę, które łączy inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.
Nano Banana Lite
Zaprojektowany jako specjalista od wydajności w rodzinie modeli generowania obrazów, który oferuje generowanie i edytowanie obrazów z bardzo małym opóźnieniem i niskimi kosztami.
Veo 3.1 (wersja testowa)
Najnowocześniejsze generowanie filmów kinowych z zaawansowanymi opcjami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.
Nano Banana Pro
Profesjonalny silnik projektowania z rdzeniem rozumującym, który umożliwia tworzenie wizualizacji 4K o jakości studyjnej, złożonych układów i precyzyjnego renderowania tekstu.
Veo 3.1 Lite (wersja testowa)
Wydajne, tanie i przyjazne dla deweloperów generowanie i edytowanie filmów oraz sterowanie kinowe z rodziny Veo 3.1.
Gemini Omni Flash (wersja testowa)
Szybkie, konwersacyjne generowanie i edytowanie filmów. Przekształcaj tekst i obrazy w filmy oraz dopracowuj wyniki za pomocą języka naturalnego.
Nano Banana
Najnowocześniejsze generowanie i edytowanie obrazów natywnych, które umożliwia szybką pracę twórczą.
Imagen 4 (wycofany)
Model zamiany tekstu na obraz, który umożliwia szybkie i bardzo szybkie generowanie oraz wyjątkową przejrzystość obrazów w rozdzielczości do 2K.
Modele generowania muzyki
Ta sekcja zawiera wszystkie modele generowania muzyki, w tym te, które mogą być już wymienione w innych sekcjach
Lyria 3 Pro (wersja testowa)
Nasz flagowy model generowania muzyki, który jest zoptymalizowany pod kątem pełnych utworów o złożonej spójności strukturalnej.
Lyria 3 Clip (wersja testowa)
Zoptymalizowany pod kątem generowania krótkich klipów muzycznych, pętli i podglądów o długości do 30 sekund.
Lyria RealTime (wersja eksperymentalna)
Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę kreatywną i możliwości przesyłania strumieniowego w czasie rzeczywistym.
Modele narzędzi i agentów
Korzystanie z komputera wersja testowa
Specjalistyczny model, który może „widzieć” ekran cyfrowy i wykonywać działania w interfejsie użytkownika, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.
Gemini Deep Research (wersja testowa)
Model agenta, który autonomicznie planuje i przeprowadza wieloetapowe badania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.
Gemini Deep Research Max (wersja testowa)
Maksymalna kompleksowość w przypadku automatycznego zbierania i syntezy kontekstu w setkach źródeł.
Antigravity Agent (wersja testowa)
Agent zarządzany do zwykłych obciążeń, który autonomicznie planuje, rozumuje, uruchamia kod, zarządza plikami i przegląda internet w bezpiecznej, izolowanej piaskownicy Linux.
Modele zadań specjalistycznych
Gemini Embedding 2
Nasz pierwszy model osadzania multimodalnego, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni osadzania, aby umożliwić zaawansowane wyszukiwanie semantyczne i systemy RAG.
Gemini Embedding
Reprezentacje wektorowe o wysokiej wymiarowości do zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.
Gemini Robotics-ER 1.6(wersja testowa)
Zaawansowany model rozumowania ucieleśnionego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla agentów robotycznych z nowymi możliwościami, takimi jak odczytywanie instrumentów oraz ulepszone rozumowanie przestrzenne i fizyczne.
Poprzednie modele
Wyłączenie Gemini 2.0 Flash
Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.
Wyłączenie Gemini 2.0 Flash-Lite
Nasz najszybszy model drugiej generacji, który jest zoptymalizowany pod kątem oszczędności i krótkiego czasu oczekiwania.
Wyłączenie Gemini 3.1 Flash-Lite (wersja testowa)
Nasz najbardziej ekonomiczny model multimodalny, który zapewnia najszybszą wydajność w przypadku zadań o wysokiej częstotliwości i niewielkiej złożoności.
Wyłączenie Gemini 3 Pro (wersja testowa)
Nasz najnowocześniejszy model rozumowania z zaawansowanym rozpoznawaniem multimodalnym.
Wzorce nazw wersji modelu
Modele Gemini są dostępne w wersjach stabilnych, testowych, najnowszych lub eksperymentalnych.
Stabilny
Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.
Na przykład: gemini-3.5-flash.
Wersja testowa
Wskazuje model w wersji testowej, który może być używany w środowisku produkcyjnym. Modele w wersji testowej zwykle mają włączone rozliczenia, mogą mieć bardziej restrykcyjne limity liczby żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.
Na przykład: gemini-2.5-flash-preview-09-2025.
Najnowsze
Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, testowa lub eksperymentalna. Ten alias zostanie zamieniony na gorąco z każdą nową wersją konkretnego wariantu modelu. Zanim wersja, która jest najnowsza, zostanie zmieniona, wyślemy e-maila z 2-tygodniowym wyprzedzeniem.
Na przykład: gemini-flash-latest.
Eksperymentalna
Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity liczby żądań. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.
Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modelu może się zmieniać.
Wycofanie modeli
Informacje o wycofywaniu modeli znajdziesz na stronie Wycofanie Gemini.