Ustalona cena, która pomoże Ci udostępnić aplikację na całym świecie
Dostępne od zaraz
Dostępne od zaraz
Dostępne od zaraz
Nasz najszybszy model multimodalny o wysokiej wydajności do wykonywania różnorodnych, powtarzalnych zadań z milionem okna kontekstu. Teraz ogólnie dostępne do użytku w środowisku produkcyjnym.
Bezpłatnie*
Limity liczby żądań**
15 RPM (żądania na minutę)
1 milion TPM (tokeny na minutę)
1500 RPD (żądania dziennie)
Cena (wejściowa)
Bezpłatnie
Kontekstowe przechowywanie w pamięci podręcznej
Bezpłatnie, do 1 miliona tokenów pamięci masowej na godzinę
Cena (dane wyjściowe)
Bezpłatnie
Prośby i odpowiedzi wykorzystywane do ulepszania naszych usług
Płatność według wykorzystania (ceny w USD)***
Limity liczby żądań**
1000 RPM (żądania na minutę)
4 miliony TPM (tokeny na minutę)
Cena (wejściowa)
0,35 USD / 1 mln tokenów (w przypadku promptów do 128 tys.tokenów)
0,70 USD / 1 mln tokenów (w przypadku promptów dłuższych niż 128 tys.)
Kontekstowe przechowywanie w pamięci podręcznej
0,0875 USD / 1 mln tokenów (w przypadku promptów do 128 tys.tokenów)
0,175 USD / 1 mln tokenów (w przypadku promptów dłuższych niż 128 tys.)
1,00 USD / 1 mln tokenów na godzinę (miejsce na dane)
Cena (dane wyjściowe)
1,05 USD / 1 mln tokenów (w przypadku promptów do 128 tys.tokenów)
2,10 USD / 1 mln tokenów (w przypadku promptów dłuższych niż 128 tys.)
Prośby i odpowiedzi wykorzystywane do ulepszania naszych usług
Nasz model nowej generacji z przełomowym oknem kontekstu obejmującym 2 miliony. Teraz ogólnie dostępne do użytku w środowisku produkcyjnym.
Bezpłatnie*
Limity liczby żądań**
2 RPM (żądania na minutę)
32 000 TPM (tokeny na minutę)
50 RPD (żądania dziennie)
Cena (wejściowa)
Bezpłatnie
Kontekstowe przechowywanie w pamięci podręcznej
Nie dotyczy
Cena (dane wyjściowe)
Bezpłatnie
Prośby i odpowiedzi wykorzystywane do ulepszania naszych usług
Płatność według wykorzystania (ceny w USD)***
Limity liczby żądań**
360 RPM (żądania na minutę)
4 miliony TPM (tokeny na minutę)
10 000 RPD (żądania dziennie)
Cena (wejściowa)
3,50 USD / 1 mln tokenów (w przypadku promptów do 128 tys.tokenów)
7,00 USD / 1 mln tokenów (w przypadku promptów dłuższych niż 128 tys.)
Kontekstowe przechowywanie w pamięci podręcznej
0,875 USD / 1 mln tokenów (w przypadku promptów do 128 tys.tokenów)
1,75 USD / 1 mln tokenów (w przypadku promptów dłuższych niż 128 tys.)
4,50 USD / 1 mln tokenów na godzinę (miejsce na dane)
Cena (dane wyjściowe)
10,50 USD / 1 mln tokenów (w przypadku promptów do 128 tys.tokenów)
21 USD / 1 mln tokenów (w przypadku promptów dłuższych niż 128 tys.)
Prośby i odpowiedzi wykorzystywane do ulepszania naszych usług
Nasz model pierwszej generacji oferujący tylko rozumowanie tekstowe i graficzne. Ogólnie dostępny do zastosowań produkcyjnych.
Bezpłatnie*
Limity liczby żądań**
15 RPM (żądania na minutę)
32 000 TPM (tokeny na minutę)
1500 RPD (żądania dziennie)
Cena (wejściowa)
Bezpłatnie
Kontekstowe przechowywanie w pamięci podręcznej
Nie dotyczy
Cena (dane wyjściowe)
Bezpłatnie
Prośby i odpowiedzi wykorzystywane do ulepszania naszych usług
Płatność według wykorzystania (ceny w USD)***
Limity liczby żądań**
360 RPM (żądania na minutę)
120 000 TPM (tokeny na minutę)
30 000 RPD (żądania dziennie)
Cena (wejściowa)
0,50 USD / 1 mln tokenów
Kontekstowe przechowywanie w pamięci podręcznej
Niedostępne
Cena (dane wyjściowe)
1,50 USD / 1 mln tokenów
Prośby i odpowiedzi wykorzystywane do ulepszania naszych usług
*Ograniczenia użytkowania na poziomie bezpłatnym Gemini API mają zastosowanie do Europejskiego Obszaru Gospodarczego (w tym UE), Wielkiej Brytanii i Szwajcarii. Zobacz Najczęstsze pytania na temat płatności.
**Określone limity liczby żądań nie są gwarantowane, a rzeczywista pojemność może się różnić. Poproś o zwiększenie limitu maksymalnej stawki (tylko w przypadku poziomu płatnego).
***Koszty wnioskowania modelu dostrojonego są rozliczane w tej samej cenie co modele podstawowe. Aby uzyskać pomoc dotyczącą płatności, zobacz Obsługa Rozliczeń usługi Google Cloud.
****Ceny mogą się różnić od cen podanych tutaj oraz cen oferowanych w Vertex AI. Informacje o cenach Vertex: dokumentacji Vertex.
Utwórz za pomocą Vertex AI, w Google Cloud