Wycena, która pozwoli Ci udostępnić aplikację całemu światu
Podgląd
Podgląd
Dostępne od zaraz
Nasz najszybszy multimodalny model o wyjątkowej szybkości i wydajności umożliwiający szybkie wykonywanie zadań o wysokiej częstotliwości. Obecnie jest dostępny w wersji testowej.
Bezpłatnie*
Limity liczby żądań**
15 obr./min (żądania na minutę)
1 milion TPM (tokeny na minutę)
1500 RPD (żądania dziennie)
Cena (dane wejściowe)
Bezpłatnie
Pamięć podręczna kontekstu – wkrótce
Nie dotyczy
Cena (wyjście)
Bezpłatnie
prompty/odpowiedzi użyte do ulepszenia naszych usług.
Płatność według wykorzystania (ceny w USD)***
Limity liczby żądań**
360 obr./min (żądania na minutę)
10 milionów TPM (tokenów na minutę)
10 000 RPD (żądania dziennie)
Cena (dane wejściowe)
0,35 USD za 1 milion tokenów (dla promptów do 128 tys.tokenów)
0,70 USD za 1 milion tokenów (dla promptów dłuższych niż 128 tys.)
Pamięć podręczna kontekstu – wkrótce
Nie dotyczy
Cena (wyjście)
1,05 USD za 1 milion tokenów (dla promptów do 128 tys.tokenów)
2,10 USD za 1 milion tokenów (dla promptów dłuższych niż 128 tys.)
prompty/odpowiedzi użyte do ulepszenia naszych usług.
Nasz wielomodalny model o wysokiej wydajności do wykonywania złożonych zadań wymagających głębokiego rozumowania i zrozumienia niuansów. Obecnie jest dostępny w wersji testowej.
Bezpłatnie*
Limity liczby żądań**
2 obr./min (żądania na minutę)
32 000 TPM (tokeny na minutę)
50 RPD (żądania dziennie)
Cena (dane wejściowe)
Bezpłatnie
Pamięć podręczna kontekstu – wkrótce
Nie dotyczy
Cena (wyjście)
Bezpłatnie
prompty/odpowiedzi użyte do ulepszenia naszych usług.
Płatność według wykorzystania (ceny w USD)***
Limity liczby żądań**
360 obr./min (żądania na minutę)
10 milionów TPM (tokenów na minutę)
10 000 RPD (żądania dziennie)
Cena (dane wejściowe)
3,50 USD za 1 milion tokenów (dla promptów do 128 tys.tokenów)
7,00 USD za 1 milion tokenów (dla promptów dłuższych niż 128 tys.)
Pamięć podręczna kontekstu – wkrótce
1,75 USD za 1 milion tokenów (dla promptów do 128 tys.tokenów)
3,50 USD za 1 milion tokenów (dla promptów dłuższych niż 128 tys.)
4,50 USD / 1 milion tokenów na godzinę (miejsce na dane)
Cena (wyjście)
10,50 USD / 1 mln tokenów (dla promptów do 128 tys.tokenów)
21 USD / 1 milion tokenów (dla promptów dłuższych niż 128 tys.)
prompty/odpowiedzi użyte do ulepszenia naszych usług.
Nasz model pierwszej generacji, który oferuje wyłącznie rozumowanie na podstawie tekstu i obrazu. Jest ogólnie dostępny do użytku w środowisku produkcyjnym.
Bezpłatnie
Limity liczby żądań**
15 obr./min (żądania na minutę)
32 000 TPM (tokeny na minutę)
1500 RPD (żądania dziennie)
Cena (dane wejściowe)
Bezpłatnie
Pamięć podręczna kontekstu – wkrótce
Nie dotyczy
Cena (wyjście)
Bezpłatnie
prompty/odpowiedzi użyte do ulepszenia naszych usług.
Płatność według wykorzystania (ceny w USD)
Limity liczby żądań**
360 obr./min (żądania na minutę)
120 000 TPM (tokeny na minutę)
30 000 RPD (żądania dziennie)
Cena (dane wejściowe)
0,50 USD za 1 milion tokenów**
Pamięć podręczna kontekstu – wkrótce
Niedostępna
Cena (wyjście)
1,50 USD za 1 milion tokenów**
prompty/odpowiedzi użyte do ulepszenia naszych usług.
*Poziom bezpłatny nie jest dostępny w krajach Europejskiego Obszaru Gospodarczego (w tym w Unii Europejskiej), Wielkiej Brytanii i Szwajcarii.
**Te limity nie są gwarantowane, a rzeczywista pojemność może się zmieniać. Poproś o zwiększenie limitu maksymalnej stawki (tylko w przypadku poziomu płatnego).
***Koszty wnioskowania na podstawie dostrojonego modelu są rozliczane w tej samej cenie co modele podstawowe.
Kompiluj z Vertex AI w Google Cloud