Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modele

Gemini 3

Gemini 3.1 Pro

Zaawansowana inteligencja, umiejętność rozwiązywania złożonych problemów oraz zaawansowane możliwości agentowe i vibe codingu.

Wersja testowa

Gemini 3.5 Flash

Najbardziej inteligentny model zapewniający stałą wydajność w zakresie zadań związanych z agentami i kodowaniem.

Stabilny

Gemini 3 Flash

Wydajność na poziomie modeli z najwyższej półki, porównywalna z większymi modelami, ale przy ułamku kosztów.

Wersja testowa

Gemini 3.1 Flash-Lite

Wydajność na poziomie modeli z najwyższej półki, porównywalna z większymi modelami, ale przy ułamku kosztów.

Stabilny

Nano Banana 2

Wydajne generowanie i edytowanie obrazów na dużą skalę, zoptymalizowane pod kątem szybkości i zastosowań wymagających dużej liczby operacji.

Stabilny

Nano Banana Pro

Najnowocześniejsze modele do generowania i edytowania obrazów, które umożliwiają tworzenie obrazów natywnych o wysokim stopniu kontekstowości.

Stabilny

Gemini 3.5 Live Translate

Model do tłumaczenia mowy na mowę w czasie rzeczywistym z krótkim czasem oczekiwania, który obsługuje ponad 70 języków.

Nowa wersja testowa

Gemini 3.1 Flash Live

Wysokiej jakości model Live API z krótkim czasem oczekiwania do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.

Nowa wersja testowa

Gemini 3.1 Flash TTS

Wydajne generowanie mowy z krótkim czasem oczekiwania.

Nowa wersja testowa

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności do zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą liczbą operacji.

Nano Banana

Najnowocześniejsze generowanie i edytowanie obrazów natywnych, które umożliwia szybką pracę twórczą.

Gemini 2.5 Flash Live (wersja testowa)

Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym, którzy przesyłają strumieniowo dźwięk natywny w czasie krótszym niż sekunda.

Gemini 2.5 Flash TTS (wersja testowa)

Generowanie dźwięku na podstawie tekstu z możliwością sterowania stylem i tempem.

Gemini 2.5 Flash-Lite

Najszybszy i najbardziej ekonomiczny model multimodalny z rodziny 2.5.

Gemini 2.5 Pro

Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.

Gemini 2.5 Pro TTS (wersja testowa)

Synteza mowy o wysokiej jakości, zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.

Modele audio

Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach

Gemini 3.1 Flash Live wersja testowa

Nasz wysokiej jakości model audio-to-audio (A2A) z krótkim czasem oczekiwania, zaprojektowany do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.

Gemini 3.1 Flash TTS (wersja testowa)

Wydajne generowanie mowy z krótkim czasem oczekiwania, z naturalnymi wynikami, sterowalnymi promptami i nowymi ekspresyjnymi tagami audio, które umożliwiają precyzyjną kontrolę nad narracją.

Gemini 2.5 Flash Live (wersja testowa)

Nasz flagowy model Live API do dwukierunkowych agentów głosowych i wideo z krótkim czasem oczekiwania, którzy mają możliwość rozumowania na podstawie dźwięku natywnego.

Gemini 2.5 Flash TTS (wersja testowa)

Szybkie i sterowalne generowanie mowy na podstawie tekstu do aplikacji z krótkim czasem oczekiwania i niskimi kosztami oraz do asystentów działających w czasie rzeczywistym.

Gemini 2.5 Pro TTS (wersja testowa)

Synteza mowy o wysokiej jakości, zoptymalizowana pod kątem jakości w uporządkowanych procesach, takich jak podcasty i audiobooki.

Modele generowania multimediów

Ta sekcja zawiera wszystkie modele generowania multimediów, w tym te, które mogą być już wymienione w innych sekcjach

Nano Banana 2

Wydajne tworzenie obrazów na dużą skalę, które łączy inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.

Veo 3.1 (wersja testowa)

Najnowocześniejsze generowanie filmów kinowych z zaawansowanymi opcjami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.

Nano Banana Pro

Profesjonalny silnik projektowania z rdzeniem rozumującym, który umożliwia tworzenie obrazów 4K o jakości studyjnej, złożonych układów i precyzyjnego renderowania tekstu.

Veo 3.1 Lite (wersja testowa)

Wydajne, tanie i przyjazne dla deweloperów generowanie i edytowanie filmów oraz sterowanie kinowe z rodziny Veo 3.1.

Nano Banana

Najnowocześniejsze generowanie i edytowanie obrazów natywnych, które umożliwia szybką pracę twórczą.

Imagen 4

Model zamiany tekstu na obraz, który umożliwia szybkie i bardzo szybkie generowanie obrazów oraz wyjątkową klarowność w rozdzielczości do 2K.

Modele generowania muzyki

Ta sekcja zawiera wszystkie modele generowania muzyki, w tym te, które mogą być już wymienione w innych sekcjach

Lyria 3 Pro (wersja testowa)

Nasz flagowy model generowania muzyki, zoptymalizowany pod kątem pełnych utworów o złożonej strukturze.

Lyria 3 Clip (wersja testowa)

Zoptymalizowany pod kątem generowania krótkich klipów muzycznych, pętli i podglądów o długości do 30 sekund.

Lyria RealTime (wersja eksperymentalna)

Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę kreatywną i możliwość przesyłania strumieniowego w czasie rzeczywistym.

Modele narzędzi i agentów

Korzystanie z komputera wersja testowa

Specjalistyczny model, który może „widzieć” ekran cyfrowy i wykonywać działania w interfejsie, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.

Gemini Deep Research (wersja testowa)

Model agentowy, który autonomicznie planuje i wykonuje wieloetapowe poszukiwania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.

Gemini Deep Research Max (wersja testowa)

Maksymalna kompleksowość w zakresie automatycznego zbierania i syntezy kontekstu w setkach źródeł.

Antigravity Agent (wersja testowa)

Agent zarządzany do zwykłych obciążeń, który autonomicznie planuje, wnioskuje, uruchamia kod, zarządza plikami i przegląda internet w bezpiecznej, odizolowanej piaskownicy Linux.

Modele do zadań specjalistycznych

Nasz pierwszy model reprezentacji właściwościowych multimodalnych, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni reprezentacji właściwościowych, aby umożliwić zaawansowane wyszukiwanie semantyczne i systemy RAG.

Gemini Embedding

Wielowymiarowe reprezentacje wektorowe do zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.

Gemini Robotics-ER 1.6(wersja testowa)

Zaawansowany model rozumowania ucieleśnionego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla agentów robotycznych z nowymi możliwościami, takimi jak odczytywanie instrumentów oraz ulepszone rozumowanie przestrzenne i fizyczne.

Poprzednie modele

Wyłączenie modelu Gemini 2.0 Flash

Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.

Wyłączenie modelu Gemini 2.0 Flash-Lite Shut down

Nasz najszybszy model drugiej generacji, zoptymalizowany pod kątem oszczędności i krótkiego czasu oczekiwania.

Wyłączenie modelu Gemini 3.1 Flash-Lite (wersja testowa)

Nasz najbardziej ekonomiczny model multimodalny, który zapewnia najszybszą wydajność w przypadku zadań o wysokiej częstotliwości i niewielkiej złożoności.

Wyłączenie modelu Gemini 3 Pro (wersja testowa)

Nasz najnowocześniejszy model rozumowania z zaawansowanym rozpoznawaniem multimodalnym.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnych, testowych, najnowszych lub eksperymentalnych.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.

Przykład: gemini-3.5-flash.

Wersja testowa

Wskazuje model w wersji testowej, który może być używany w środowisku produkcyjnym. Modele w wersji testowej zwykle mają włączone rozliczenia, mogą mieć bardziej restrykcyjne limity żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.

Przykład: gemini-2.5-flash-preview-09-2025.

Najnowsze

Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, testowa lub eksperymentalna. Ten alias będzie automatycznie zamieniany na każdą nową wersję konkretnego wariantu modelu. Zanim zmienimy wersję, która jest starsza od najnowszej, wyślemy e-maila z 2-tygodniowym wyprzedzeniem.

Przykład: gemini-flash-latest.

Eksperymentalna

Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity żądań. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modelu może się zmieniać.

Wycofanie modeli

Informacje o wycofywaniu modeli znajdziesz na stronie Wycofanie Gemini.