Przedstawiamy wersję testową Gemini 3.1 Pro. Wypróbuj bezpłatnie w Google AI Studio

Modele

Gemini 3

Gemini 3.1 Pro

Zaawansowana inteligencja, umiejętności rozwiązywania złożonych problemów oraz zaawansowane możliwości kodowania agentów i stylu.

Nowość Podgląd

Gemini 3 Flash

Wydajność klasy Frontier porównywalna z większymi modelami przy ułamku kosztów.

Podgląd

Nano Banana Pro

Najnowocześniejsze modele do generowania i edytowania obrazów, które umożliwiają tworzenie wysoce kontekstowych obrazów natywnych.

Podgląd

Gemini 3 Pro

Nasz najnowocześniejszy model rozumujący z zaawansowanym rozumieniem multimodalnym.

Podgląd

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności w przypadku zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą liczbą zapytań.

Nano Banana

Najnowocześniejszy model do generowania i edytowania obrazów natywnych, zaprojektowany z myślą o szybkiej pracy twórczej.

Gemini 2.5 Flash Live (wersja testowa)

Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym, którzy przesyłają strumieniowo dźwięk w czasie poniżej sekundy.

Gemini 2.5 Flash TTS (wersja testowa)

Kontrolowane generowanie dźwięku za pomocą zamiany tekstu na mowę z precyzyjną kontrolą stylu i tempa.

Gemini 2.5 Flash-Lite

Najszybszy i najbardziej przystępny cenowo model multimodalny z rodziny 2.5.

Gemini 2.5 Pro

Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.

Gemini 2.5 Pro TTS wersja testowa

Synteza mowy o wysokiej wierności zoptymalizowana pod kątem jakości w przypadku ustrukturyzowanych przepływów pracy, takich jak podcasty i audiobooki.

Modele audio

Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach.

Gemini 2.5 Flash Live (wersja testowa)

Nasz flagowy model interfejsu Live API do dwukierunkowych agentów głosowych i wideo o krótkim czasie oczekiwania z natywnym rozumowaniem dźwięku.

Gemini 2.5 Flash TTS (wersja testowa)

Szybka i łatwa w obsłudze zamiana tekstu na mowę w przypadku aplikacji o niskich opóźnieniach i kosztach oraz asystentów działających w czasie rzeczywistym.

Gemini 2.5 Pro TTS wersja testowa

Synteza mowy o wysokiej wierności zoptymalizowana pod kątem jakości w przypadku ustrukturyzowanych przepływów pracy, takich jak podcasty i audiobooki.

Lyria eksperymentalna

Model generowania muzyki o wysokiej wierności, który zapewnia szczegółową kontrolę nad instrumentami, tempem i złożonymi kompozycjami.

Generatywne modele multimedialne

Ta sekcja zawiera wszystkie modele generatywnych mediów, w tym te, które mogą być już wymienione w innych sekcjach.

Veo 3.1 Podgląd

Najnowocześniejsza technologia generowania filmów z zaawansowanymi ustawieniami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.

Nano Banana Pro wersja testowa

Profesjonalny silnik projektowania z rdzeniem rozumowania, który zapewnia wizualizacje w jakości studyjnej 4K, złożone układy i precyzyjne renderowanie tekstu.

Nano Banana

Najnowocześniejszy model do generowania i edytowania obrazów natywnych, zaprojektowany z myślą o szybkiej pracy twórczej.

Lyria eksperymentalna

Model generowania muzyki o wysokiej wierności, który zapewnia szczegółową kontrolę nad instrumentami, tempem i złożonymi kompozycjami.

Imagen 4

Model tworzenia obrazu na podstawie tekstu, który umożliwia szybkie i bardzo szybkie generowanie obrazów o wyjątkowej wyrazistości w rozdzielczości do 2K.

Modele narzędzi i agenta

Korzystanie z komputera (wersja przedpremierowa)

Specjalistyczny model, który „widzi” ekran cyfrowy i wykonuje działania w interfejsie, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.

Deep Research w Gemini (wersja podglądowa)

Model agentowy, który autonomicznie planuje i przeprowadza wieloetapowe poszukiwania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.

Modele do zadań specjalistycznych

Gemini Embeddings

Wielowymiarowe reprezentacje wektorowe do zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.

Gemini Robotics (wersja testowa)

Zaawansowany model rozumowania przestrzennego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla robotów.

Poprzednie modele

Gemini 2.0 Flash Wycofany

Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu o wielkości 1 mln tokenów.

Gemini 2.0 Flash-Lite Wycofany

Nasz najszybszy model drugiej generacji, zoptymalizowany pod kątem opłacalności i niskich opóźnień.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnej, wersji zapoznawczej, najnowszej lub eksperymentalnej.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna korzystać z określonego stabilnego modelu.

Przykład: gemini-2.5-flash.

Podgląd

Wskazuje model w wersji podglądu, który może być używany w środowisku produkcyjnym. W przypadku modeli w wersji testowej zwykle włączone są płatności, mogą one mieć bardziej restrykcyjne limity stawek i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.

Przykład: gemini-2.5-flash-preview-09-2025.

Najnowsze

Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, podglądowa lub eksperymentalna. Ten alias będzie wymieniany na gorąco z każdą nową wersją konkretnego modelu. 2-tygodniowe powiadomienie o zmianie wersji starszej niż najnowsza zostanie wysłane e-mailem.

Przykład: gemini-flash-latest.

Eksperymentalna

Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity szybkości. Udostępniamy modele eksperymentalne, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modeli może się zmienić.

Wycofane modele

Informacje o wycofywaniu modeli znajdziesz na stronie Wycofywanie Gemini.