Modele


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności do zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą ilością danych.

Nano Banana

Najnowocześniejsze natywne generowanie i edytowanie obrazów zaprojektowane pod kątem szybkiej pracy twórczej.

Wersja testowa Gemini 2.5 Flash Live Preview

Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym z natywnym przesyłaniem strumieniowym dźwięku w czasie krótszym niż sekunda.

Wersja testowa Gemini 2.5 Flash TTS

Generowanie dźwięku z zamiany tekstu na mowę z możliwością kontrolowania stylu i tempa.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

Najszybszy i najbardziej ekonomiczny model multimodalny z rodziny 2.5.


Gemini 2.5 Pro

Gemini 2.5 Pro

Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.

Wersja testowa Gemini 2.5 Pro TTS

Synteza mowy o wysokiej jakości zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.


Modele audio

Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach

Wersja testowa Gemini 3.1 Flash Live Preview

Nasz wysokiej jakości model audio-to-audio (A2A) z krótkim czasem oczekiwania, zaprojektowany do prowadzenia rozmów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.

Wersja testowa Gemini 3.1 Flash TTS

Wydajne generowanie mowy z krótkim czasem oczekiwania, naturalnymi wynikami, sterowalnymi promptami i nowymi ekspresyjnymi tagami audio do precyzyjnej kontroli narracji.

Wersja testowa Gemini 2.5 Flash Live Preview

Nasz flagowy model Live API do dwukierunkowych agentów głosowych i wideo z krótkim czasem oczekiwania oraz natywnym rozumowaniem audio.

Wersja testowa Gemini 2.5 Flash TTS

Szybka i sterowalna zamiana tekstu na mowę do aplikacji z krótkim czasem oczekiwania i niskimi kosztami oraz asystentów działających w czasie rzeczywistym.

Wersja testowa Gemini 2.5 Pro TTS

Synteza mowy o wysokiej jakości zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.


Generatywne modele multimedialne

Ta sekcja zawiera wszystkie generatywne modele multimedialne, w tym te, które mogą być już wymienione w innych sekcjach

Wersja testowaNano Banana 2

Wydajne tworzenie wizualne na dużą skalę, które łączy inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.

Wersja testowa Veo 3.1

Najnowocześniejsze generowanie filmów kinowych z zaawansowanymi opcjami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.

Wersja testowa Nano Banana Pro

Profesjonalny silnik projektowy z rdzeniem rozumującym, który umożliwia tworzenie wizualizacji 4K o jakości studyjnej, złożonych układów i precyzyjnego renderowania tekstu.

Wersja testowa Veo 3.1 Lite

Wydajne, tanie i przyjazne dla deweloperów generowanie i edytowanie filmów oraz sterowanie kinowe z rodziny Veo 3.1.

Nano Banana

Najnowocześniejsze natywne generowanie i edytowanie obrazów zaprojektowane pod kątem szybkiej pracy twórczej.

Imagen 4

Model zamiany tekstu na obraz, który umożliwia szybkie i bardzo szybkie generowanie oraz wyjątkową przejrzystość w rozdzielczości do 2K.


Modele generowania muzyki

Ta sekcja zawiera wszystkie modele generowania muzyki, w tym te, które mogą być już wymienione w innych sekcjach

Wersja testowa Lyria 3 Pro

Nasz flagowy model generowania muzyki, zoptymalizowany pod kątem pełnych utworów o złożonej spójności strukturalnej.

Wersja testowa Lyria 3 Clip Preview

Zoptymalizowany pod kątem generowania krótkich klipów muzycznych, pętli i podglądów o długości do 30 sekund.

Wersja eksperymentalna Lyria RealTime

Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę kreatywną i możliwości przesyłania strumieniowego w czasie rzeczywistym.


Modele narzędzi i agentów

Wersja testowa Computer Use

Specjalistyczny model, który może „widzieć” ekran cyfrowy i wykonywać działania w interfejsie użytkownika, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.

Wersja testowa Gemini Deep Research Preview

Model agentowy, który autonomicznie planuje i wykonuje wieloetapowe badania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.

Wersja testowa Gemini Deep Research Max

Maksymalna kompleksowość w zakresie automatycznego zbierania i syntezy kontekstu w setkach źródeł.

Wersja testowa Antigravity Agent

Zarządzany agent do zwykłych obciążeń, który autonomicznie planuje, wnioskuje, uruchamia kod, zarządza plikami i przegląda internet w bezpiecznej, odizolowanej piaskownicy systemu Linux.


Modele zadań specjalistycznych

Gemini Embedding 2

Nasz pierwszy model osadzania multimodalnego, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni osadzania na potrzeby zaawansowanego wyszukiwania semantycznego i systemów RAG.

Gemini Embedding

Reprezentacje wektorowe o wysokiej wymiarowości na potrzeby zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.

Wersja testowa Gemini Robotics-ER 1.6

Zaawansowany model rozumowania ucieleśnionego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla agentów robotycznych z nowymi możliwościami, takimi jak odczytywanie instrumentów oraz ulepszone rozumowanie przestrzenne i fizyczne.


Poprzednie modele

Wycofany model Gemini 2.0 Flash

Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.

Wycofany model Gemini 2.0 Flash-Lite

Nasz najszybszy model drugiej generacji, zoptymalizowany pod kątem oszczędności i krótkiego czasu oczekiwania.

Wyłączenie wersji testowej Gemini 3 Pro

Nasz najnowocześniejszy model rozumowania z zaawansowanym rozpoznawaniem multimodalnym.


Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnych, testowych, najnowszych lub eksperymentalnych.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.

Na przykład: gemini-2.5-flash.

Wersja testowa

Wskazuje model w wersji testowej, który może być używany w środowisku produkcyjnym. Modele w wersji testowej zwykle mają włączone rozliczenia, mogą mieć bardziej restrykcyjne limity żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.

Na przykład: gemini-2.5-flash-preview-09-2025.

Najnowsze

Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, testowa lub eksperymentalna. Ten alias zostanie zamieniony na gorąco z każdą nową wersją konkretnego wariantu modelu. Zanim zmienimy wersję, która jest starsza od najnowszej, wyślemy e-maila z 2-tygodniowym wyprzedzeniem.

Na przykład: gemini-flash-latest.

Eksperymentalna

Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity żądań. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modelu może się zmienić.

Wycofanie modeli

Więcej informacji o wycofywaniu modeli znajdziesz na stronie Wycofanie Gemini.