Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modele

Gemini 3

Stabilny

Gemini 3.5 Flash

Najinteligentniejszy model zapewniający stałą, przełomową wydajność w przypadku zadań związanych z agentami i kodowaniem.

Stabilny

Gemini 3.1 Flash-Lite

Wydajność klasy przełomowej, która dorównuje większym modelom, ale przy ułamku kosztów.

Stabilny

Nano Banana 2

Wydajne generowanie i edytowanie obrazów o wysokiej jakości, zoptymalizowane pod kątem szybkości i zastosowań wymagających dużej ilości danych.

Stabilny

Nano Banana Lite

Generowanie i edytowanie obrazów z bardzo małym opóźnieniem i niskimi kosztami, zaprojektowane pod kątem zastosowań interaktywnych wymagających dużej ilości danych.

Stabilny

Nano Banana Pro

Najnowocześniejsze modele do generowania i edytowania obrazów, które umożliwiają tworzenie obrazów natywnych o wysokim stopniu kontekstowości.

Stabilny

Wersja testowa

Gemini 3.1 Pro

Zaawansowana inteligencja, umiejętności rozwiązywania złożonych problemów oraz zaawansowane możliwości kodowania agentów i vibe codingu.

Wersja testowa

Gemini 3 Flash

Wydajność klasy przełomowej, która dorównuje większym modelom, ale przy ułamku kosztów.

Wersja testowa

Gemini 3.5 Live Translate

Model tłumaczenia mowy na mowę w czasie rzeczywistym z krótkim czasem oczekiwania, który obsługuje ponad 70 języków.

Nowa wersja testowa

Gemini 3.1 Flash Live

Wysokiej jakości model Live API z krótkim czasem oczekiwania do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.

Nowa wersja testowa

Gemini 3.1 Flash TTS

Wydajne generowanie mowy z krótkim czasem oczekiwania.

Nowa wersja testowa

Gemini Omni Flash

Szybkie, konwersacyjne generowanie i edytowanie filmów. Przekształcaj tekst i obrazy w filmy oraz dopracowuj wyniki za pomocą języka naturalnego.

Nowa wersja testowa

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności w przypadku zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą ilością danych.

Nano Banana

Najnowocześniejsze generowanie i edytowanie obrazów natywnych, które umożliwia szybką pracę twórczą.

Gemini 2.5 Flash Live (wersja testowa)

Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym, którzy przesyłają strumieniowo natywny dźwięk w czasie krótszym niż sekunda.

Gemini 2.5 Flash TTS (wersja testowa)

Generowanie dźwięku za pomocą funkcji zamiany tekstu na mowę z możliwością kontrolowania stylu i tempa.

Gemini 2.5 Flash-Lite

Najszybszy i najbardziej ekonomiczny model multimodalny z rodziny 2.5.

Gemini 2.5 Pro

Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.

Gemini 2.5 Pro TTS (wersja testowa)

Synteza mowy o wysokiej jakości, zoptymalizowana pod kątem jakości w przypadku uporządkowanych przepływów pracy, takich jak podcasty i audiobooki.

Modele audio

Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach

Gemini 3.1 Flash Live wersja testowa

Nasz model audio-to-audio (A2A) o wysokiej jakości i krótkim czasie oczekiwania, który jest przeznaczony do prowadzenia dialogów w czasie rzeczywistym i tworzenia aplikacji AI opartych na głosie.

Gemini 3.1 Flash TTS (wersja testowa)

Wydajne generowanie mowy z krótkim czasem oczekiwania, naturalnymi wynikami, sterowalnymi promptami i nowymi ekspresyjnymi tagami audio, które umożliwiają precyzyjną kontrolę nad narracją.

Gemini 2.5 Flash Live (wersja testowa)

Nasz flagowy model Live API do dwukierunkowych agentów głosowych i wideo z krótkim czasem oczekiwania oraz natywnym rozumowaniem audio.

Gemini 2.5 Flash TTS (wersja testowa)

Szybka i sterowalna funkcja zamiany tekstu na mowę do aplikacji z krótkim czasem oczekiwania i niskimi kosztami oraz asystentów działających w czasie rzeczywistym.

Gemini 2.5 Pro TTS (wersja testowa)

Synteza mowy o wysokiej jakości, zoptymalizowana pod kątem jakości w przypadku uporządkowanych przepływów pracy, takich jak podcasty i audiobooki.

Generatywne modele multimedialne

Ta sekcja zawiera wszystkie generatywne modele multimedialne, w tym te, które mogą być już wymienione w innych sekcjach

Nano Banana 2

Wydajne tworzenie wizualne na dużą skalę, które łączy inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.

Nano Banana Lite

Zaprojektowany jako specjalista od wydajności w rodzinie modeli generowania obrazów, który oferuje generowanie i edytowanie obrazów z bardzo małym opóźnieniem i niskimi kosztami.

Veo 3.1 (wersja testowa)

Najnowocześniejsze generowanie filmów kinowych z zaawansowanymi opcjami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.

Nano Banana Pro

Profesjonalny silnik projektowania z rdzeniem rozumującym, który umożliwia tworzenie wizualizacji 4K o jakości studyjnej, złożonych układów i precyzyjnego renderowania tekstu.

Veo 3.1 Lite (wersja testowa)

Wydajne, tanie i przyjazne dla deweloperów generowanie i edytowanie filmów oraz sterowanie kinowe z rodziny Veo 3.1.

Gemini Omni Flash (wersja testowa)

Szybkie, konwersacyjne generowanie i edytowanie filmów. Przekształcaj tekst i obrazy w filmy oraz dopracowuj wyniki za pomocą języka naturalnego.

Nano Banana

Najnowocześniejsze generowanie i edytowanie obrazów natywnych, które umożliwia szybką pracę twórczą.

Imagen 4 (wycofany)

Model zamiany tekstu na obraz, który umożliwia szybkie i bardzo szybkie generowanie oraz wyjątkową przejrzystość obrazów w rozdzielczości do 2K.

Modele generowania muzyki

Ta sekcja zawiera wszystkie modele generowania muzyki, w tym te, które mogą być już wymienione w innych sekcjach

Lyria 3 Pro (wersja testowa)

Nasz flagowy model generowania muzyki, który jest zoptymalizowany pod kątem pełnych utworów o złożonej spójności strukturalnej.

Lyria 3 Clip (wersja testowa)

Zoptymalizowany pod kątem generowania krótkich klipów muzycznych, pętli i podglądów o długości do 30 sekund.

Lyria RealTime (wersja eksperymentalna)

Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę kreatywną i możliwości przesyłania strumieniowego w czasie rzeczywistym.

Modele narzędzi i agentów

Korzystanie z komputera wersja testowa

Specjalistyczny model, który może „widzieć” ekran cyfrowy i wykonywać działania w interfejsie użytkownika, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.

Gemini Deep Research (wersja testowa)

Model agenta, który autonomicznie planuje i przeprowadza wieloetapowe badania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.

Gemini Deep Research Max (wersja testowa)

Maksymalna kompleksowość w przypadku automatycznego zbierania i syntezy kontekstu w setkach źródeł.

Antigravity Agent (wersja testowa)

Agent zarządzany do zwykłych obciążeń, który autonomicznie planuje, rozumuje, uruchamia kod, zarządza plikami i przegląda internet w bezpiecznej, izolowanej piaskownicy Linux.

Modele zadań specjalistycznych

Gemini Embedding 2

Nasz pierwszy model osadzania multimodalnego, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni osadzania, aby umożliwić zaawansowane wyszukiwanie semantyczne i systemy RAG.

Gemini Embedding

Reprezentacje wektorowe o wysokiej wymiarowości do zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.

Gemini Robotics-ER 1.6(wersja testowa)

Zaawansowany model rozumowania ucieleśnionego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla agentów robotycznych z nowymi możliwościami, takimi jak odczytywanie instrumentów oraz ulepszone rozumowanie przestrzenne i fizyczne.

Poprzednie modele

Wyłączenie Gemini 2.0 Flash

Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.

Wyłączenie Gemini 2.0 Flash-Lite

Nasz najszybszy model drugiej generacji, który jest zoptymalizowany pod kątem oszczędności i krótkiego czasu oczekiwania.

Wyłączenie Gemini 3.1 Flash-Lite (wersja testowa)

Nasz najbardziej ekonomiczny model multimodalny, który zapewnia najszybszą wydajność w przypadku zadań o wysokiej częstotliwości i niewielkiej złożoności.

Wyłączenie Gemini 3 Pro (wersja testowa)

Nasz najnowocześniejszy model rozumowania z zaawansowanym rozpoznawaniem multimodalnym.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnych, testowych, najnowszych lub eksperymentalnych.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.

Na przykład: gemini-3.5-flash.

Wersja testowa

Wskazuje model w wersji testowej, który może być używany w środowisku produkcyjnym. Modele w wersji testowej zwykle mają włączone rozliczenia, mogą mieć bardziej restrykcyjne limity liczby żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.

Na przykład: gemini-2.5-flash-preview-09-2025.

Najnowsze

Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, testowa lub eksperymentalna. Ten alias zostanie zamieniony na gorąco z każdą nową wersją konkretnego wariantu modelu. Zanim wersja, która jest najnowsza, zostanie zmieniona, wyślemy e-maila z 2-tygodniowym wyprzedzeniem.

Na przykład: gemini-flash-latest.

Eksperymentalna

Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity liczby żądań. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modelu może się zmieniać.

Wycofanie modeli

Informacje o wycofywaniu modeli znajdziesz na stronie Wycofanie Gemini.