Modele


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności do zadań wymagających rozumowania, krótkiego czasu oczekiwania i dużej ilości danych.

Nano Banana

Najnowocześniejsze generowanie i edytowanie obrazów natywnych zaprojektowane pod kątem szybkiej pracy twórczej.

Podgląd Gemini 2.5 Flash Live

Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym z natywnym przesyłaniem strumieniowym dźwięku w czasie krótszym niż sekunda.

Podgląd Gemini 2.5 Flash TTS

Generowanie dźwięku na podstawie tekstu z możliwością sterowania stylem i tempem.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

Najszybszy i najbardziej ekonomiczny model multimodalny z rodziny 2.5.


Gemini 2.5 Pro

Gemini 2.5 Pro

Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.

Podgląd Gemini 2.5 Pro TTS

Synteza mowy o wysokiej jakości zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.


Modele audio

Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach

Podgląd Gemini 3.1 Flash Live

Nasz wysokiej jakości model audio-to-audio (A2A) o krótkim czasie oczekiwania zaprojektowany do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.

Podgląd Gemini 3.1 Flash TTS

Zaawansowane generowanie mowy z krótkim czasem oczekiwania, naturalnymi wynikami, sterowalnymi promptami i nowymi ekspresyjnymi tagami audio do precyzyjnej kontroli narracji.

Podgląd Gemini 2.5 Flash Live

Nasz flagowy model Live API do dwukierunkowych agentów głosowych i wideo o krótkim czasie oczekiwania z natywnym rozumowaniem audio.

Podgląd Gemini 2.5 Flash TTS

Szybka i sterowalna synteza mowy na potrzeby aplikacji o krótkim czasie oczekiwania i niskich kosztach oraz asystentów działających w czasie rzeczywistym.

Podgląd Gemini 2.5 Pro TTS

Synteza mowy o wysokiej jakości zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.


Modele generowania multimediów

Ta sekcja zawiera wszystkie modele generowania multimediów, w tym te, które mogą być już wymienione w innych sekcjach

Nano Banana 2

Wysoko wydajne tworzenie wizualne na dużą skalę, łączące inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.

Podgląd Veo 3.1

Najnowocześniejsze generowanie filmów kinowych z zaawansowanymi opcjami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.

Nano Banana Pro

Profesjonalny silnik projektowy z rdzeniem rozumującym do tworzenia wizualizacji 4K o jakości studyjnej, złożonych układów i precyzyjnego renderowania tekstu.

Podgląd Veo 3.1 Lite

Wysoko wydajne, tanie i przyjazne dla deweloperów generowanie i edytowanie filmów oraz sterowanie kinowe z rodziny Veo 3.1.

Nano Banana

Najnowocześniejsze generowanie i edytowanie obrazów natywnych zaprojektowane pod kątem szybkiej pracy twórczej.

Imagen 4

Model zamiany tekstu na obraz, który zapewnia szybkie i bardzo szybkie generowanie oraz wyjątkową klarowność w rozdzielczości do 2K.


Modele generowania muzyki

Ta sekcja zawiera wszystkie modele generowania muzyki, w tym te, które mogą być już wymienione w innych sekcjach

Podgląd Lyria 3 Pro

Nasz flagowy model generowania muzyki zoptymalizowany pod kątem pełnych utworów o złożonej spójności strukturalnej.

Podgląd Lyria 3 Clip

Zoptymalizowany pod kątem generowania krótkich klipów muzycznych, pętli i podglądów o długości do 30 sekund.

Lyria RealTime (wersja eksperymentalna)

Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę kreatywną i możliwości przesyłania strumieniowego w czasie rzeczywistym.


Modele narzędzi i agentów

Podgląd korzystania z komputera

Specjalistyczny model, który może „widzieć” ekran cyfrowy i wykonywać działania w interfejsie użytkownika, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.

Podgląd Gemini Deep Research

Model agentowy, który autonomicznie planuje i realizuje wieloetapowe badania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.

Podgląd Gemini Deep Research Max

Maksymalna kompleksowość w zakresie automatycznego zbierania i syntezy kontekstu w setkach źródeł.

Podgląd agenta Antigravity

Agent zarządzany do zwykłych obciążeń, który autonomicznie planuje, wnioskuje, uruchamia kod, zarządza plikami i przegląda internet w bezpiecznej, izolowanej piaskownicy Linux.


Modele zadań specjalistycznych

Gemini Embedding 2

Nasz pierwszy model osadzania multimodalnego, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni osadzania na potrzeby zaawansowanego wyszukiwania semantycznego i systemów RAG.

Gemini Embedding

Wielowymiarowe reprezentacje wektorowe na potrzeby zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.

Podgląd Gemini Robotics-ER 1.6

Zaawansowany model rozumowania ucieleśnionego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla agentów robotycznych z nowymi możliwościami, takimi jak odczytywanie instrumentów oraz ulepszone rozumowanie przestrzenne i fizyczne.


Poprzednie modele

Wyłączenie Gemini 2.0 Flash

Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.

Wyłączenie Gemini 2.0 Flash-Lite

Nasz najszybszy model drugiej generacji zoptymalizowany pod kątem oszczędności i krótkiego czasu oczekiwania.

Wyłączenie podglądu Gemini 3.1 Flash-Lite

Nasz najbardziej ekonomiczny model multimodalny, który zapewnia najszybszą wydajność w przypadku zadań o wysokiej częstotliwości i niewielkiej złożoności.

Wyłączenie podglądu Gemini 3 Pro

Nasz najnowocześniejszy model rozumowania z zaawansowanym rozpoznawaniem multimodalnym.


Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnych, podglądowych, najnowszych lub eksperymentalnych.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.

Na przykład: gemini-3.5-flash.

Podgląd

Wskazuje model podglądowy, który może być używany w środowisku produkcyjnym. Modele podglądowe zwykle mają włączone rozliczenia, mogą mieć bardziej restrykcyjne limity żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.

Na przykład: gemini-2.5-flash-preview-09-2025.

Najnowsze

Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, podglądowa lub eksperymentalna. Ten alias zostanie zamieniony na nową wersję przy każdej nowej wersji konkretnego wariantu modelu. Zanim wersja, która jest najnowsza, zostanie zmieniona, wyślemy e-maila z 2-tygodniowym wyprzedzeniem.

Na przykład: gemini-flash-latest.

Eksperymentalna

Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity żądań. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modelu może się zmienić.

Wycofanie modeli

Więcej informacji o wycofywaniu modeli znajdziesz na stronie Wycofanie Gemini.