Limitet e shpejtësisë rregullojnë numrin e kërkesave që mund t'i bëni Gemini API brenda një afati kohor të caktuar. Këto kufizime ndihmojnë në ruajtjen e përdorimit të drejtë, mbrojtjen nga abuzimi dhe ndihmojnë në ruajtjen e performancës së sistemit për të gjithë përdoruesit.
Shikoni limitet tuaja të normës aktive në AI Studio
Si funksionojnë kufijtë e tarifave
Limitet e normës zakonisht maten në tre dimensione:
- Kërkesa për minutë ( RPM )
- Tokenë për minutë (hyrje) ( TPM )
- Kërkesat në ditë ( RPD )
Përdorimi juaj vlerësohet kundrejt secilit limit dhe tejkalimi i ndonjërit prej tyre do të shkaktojë një gabim në limitin e shpejtësisë. Për shembull, nëse limiti juaj i RPM është 20, bërja e 21 kërkesave brenda një minute do të rezultojë në një gabim, edhe nëse nuk e keni tejkaluar TPM-në tuaj ose limite të tjera.
Limitet e normës zbatohen për çdo projekt, jo për çdo çelës API.
Kuotat e kërkesave në ditë ( RPD ) rivendosen në mesnatë sipas kohës së Paqësorit.
Limitet ndryshojnë në varësi të modelit specifik që përdoret, dhe disa kufizime vlejnë vetëm për modele specifike. Për shembull, Imazhe për minutë, ose IPM, llogaritet vetëm për modelet e afta për të gjeneruar imazhe (Imagen 3), por është konceptualisht i ngjashëm me TPM. Modele të tjera mund të kenë një limit token për ditë (TPD).
Limitet e shpejtësisë janë më të kufizuara për modelet eksperimentale dhe ato paraprake.
Nivelet e përdorimit
Limitet e tarifave janë të lidhura me nivelin e përdorimit të projektit. Ndërsa përdorimi dhe shpenzimet e API-t tuaj rriten, do të keni mundësinë të përmirësoheni në një nivel më të lartë me limite më të larta tarifash.
Kualifikimet për Nivelet 2 dhe 3 bazohen në shpenzimet totale kumulative për shërbimet e Google Cloud (duke përfshirë, por pa u kufizuar në, Gemini API) për llogarinë e faturimit të lidhur me projektin tuaj.
| Shtresa | Kualifikimet |
|---|---|
| Falas | Përdoruesit në vendet e përshtatshme |
| Niveli 1 | Llogaria e faturimit e lidhur me projektin |
| Niveli 2 | Shpenzime totale: > 250 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme |
| Niveli 3 | Shpenzime totale: > 1,000 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme |
Kur kërkoni një përmirësim, sistemi ynë i automatizuar i mbrojtjes nga abuzimi kryen kontrolle shtesë. Ndërsa përmbushja e kritereve të deklaruara të kualifikimit është përgjithësisht e mjaftueshme për miratim, në raste të rralla një kërkesë për përmirësim mund të refuzohet bazuar në faktorë të tjerë të identifikuar gjatë procesit të shqyrtimit.
Ky sistem ndihmon në ruajtjen e sigurisë dhe integritetit të platformës Gemini API për të gjithë përdoruesit.
Limitet standarde të normës së API-t
Tabela e mëposhtme rendit kufijtë e tarifave për të gjitha thirrjet standarde të Gemini API.
Niveli i Lirë
| Model | RPM | TPM | RPD |
|---|---|---|---|
| Modelet e nxjerrjes së tekstit | |||
| Gemini 2.5 Pro | 5 | 125,000 | 100 |
| Binjakët 2.5 Flash | 10 | 250,000 | 250 |
| Pamje paraprake e flashit Gemini 2.5 | 10 | 250,000 | 250 |
| Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
| Pamje paraprake e Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
| Binjakët 2.0 Flash | 15 | 1,000,000 | 200 |
| Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
| API i drejtpërdrejtë | |||
| Gemini 2.5 Flash Live | * | 1,000,000 | * |
| Parapamje paraprake e flash Gemini 2.5 Audio vendase | * | 500,000 | * |
| Gemini 2.0 Flash Live | * | 1,000,000 | * |
| Modelet e gjenerimit multimodal | |||
| TTS për Pamjen e Flash-it Gemini 2.5 | 3 | 10,000 | 15 |
| Gjenerimi i imazhit paraprak të flashit Gemini 2.0 | 10 | 200,000 | 100 |
| Modele të tjera | |||
| Gemma 3 dhe 3n | 30 | 15,000 | 14,400 |
| Vendosja e Binjakëve | 100 | 30,000 | 1,000 |
| Pamje paraprake e Gemini Robotics-ER 1.5 | 10 | 250,000 | 250 |
| Modele të vjetruara | |||
| Gemini 1.5 Flash (I vjetruar) | 15 | 250,000 | 50 |
| Gemini 1.5 Flash-8B (I vjetruar) | 15 | 250,000 | 50 |
Niveli 1
| Model | RPM | TPM | RPD | Tokenët e Vendosur në Radhë të Grupit |
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
| Binjakët 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
| Pamje paraprake e flashit Gemini 2.5 | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
| Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 |
| Pamje paraprake e Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 |
| Binjakët 2.0 Flash | 2,000 | 4,000,000 | * | 10,000,000 |
| Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 |
| API i drejtpërdrejtë | ||||
| Gemini 2.5 Flash Live | 50 seanca | 4,000,000 | * | * |
| Parapamje paraprake e flash Gemini 2.5 Audio vendase | * | 1,000,000 | * | * |
| Gemini 2.0 Flash Live | 50 seanca | 4,000,000 | * | * |
| Modelet e gjenerimit multimodal | ||||
| TTS për Pamjen e Flash-it Gemini 2.5 | 10 | 10,000 | 100 | * |
| TTS për Pamjen e Pamjes së Gemini 2.5 Pro | 10 | 10,000 | 50 | * |
| Imazh Flash i Gemini 2.5 | 500 | 500,000 | 2,000 | * |
| Gjenerimi i imazhit paraprak të flashit Gemini 2.0 | 1,000 | 1,000,000 | 10,000 | * |
| Imazh 4 Standard/Shpejt | 10 | * | 70 | * |
| Imazh 4 Ultra | 5 | * | 30 | * |
| Imazhi 3 | 20 | * | * | * |
| Veo 3.1 | 2 | * | 10 | * |
| Veo 3.1 i Shpejtë | 2 | * | 10 | * |
| Veo 3 | 2 | * | 10 | * |
| Veo 3 i Shpejtë | 2 | * | 10 | * |
| Veo 2 | 2 | * | 50 | * |
| Modele të tjera | ||||
| Gemma 3 dhe 3n | 30 | 15,000 | 14,400 | * |
| Vendosja e Binjakëve | 3,000 | 1,000,000 | * | * |
| Pamje paraprake e Gemini Robotics-ER 1.5 | 300 | 1,000,000 | 10,000 | * |
| Pamje paraprake e përdorimit të kompjuterit Gemini 2.5 | 150 | 2,000,000 | 10,000 | * |
| Modele të vjetruara | ||||
| Gemini 1.5 Flash (I vjetruar) | 2,000 | 4,000,000 | * | * |
| Gemini 1.5 Flash-8B (I vjetruar) | 4,000 | 4,000,000 | * | * |
| Gemini 1.5 Pro (I vjetruar) | 1,000 | 4,000,000 | * | * |
Niveli 2
| Model | RPM | TPM | RPD | Tokenët e Vendosur në Radhë të Grupit |
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
| Binjakët 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
| Pamje paraprake e flashit Gemini 2.5 | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
| Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | * | 500,000,000 |
| Pamje paraprake e Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | * | 500,000,000 |
| Binjakët 2.0 Flash | 10,000 | 10,000,000 | * | 1,000,000,000 |
| Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | * | 1,000,000,000 |
| API i drejtpërdrejtë | ||||
| Gemini 2.5 Flash Live | 1,000 seanca | 10,000,000 | * | * |
| Parapamje paraprake e flash Gemini 2.5 Audio vendase | * | 10,000,000 | * | * |
| Gemini 2.0 Flash Live | 1,000 seanca | 10,000,000 | * | * |
| Modelet e gjenerimit multimodal | ||||
| TTS për Pamjen e Flash-it Gemini 2.5 | 1,000 | 100,000 | 10,000 | * |
| TTS për Pamjen e Pamjes së Gemini 2.5 Pro | 100 | 25,000 | 1,000 | * |
| Imazh Flash i Gemini 2.5 | 2,000 | 1,500,000 | 50,000 | * |
| Gjenerimi i imazhit paraprak të flashit Gemini 2.0 | 2,000 | 3,000,000 | 100,000 | * |
| Imazh 4 Standard/Shpejt | 15 | * | 1000 | * |
| Imazh 4 Ultra | 10 | * | 400 | * |
| Imazhi 3 | 20 | * | * | * |
| Veo 3.1 | 4 | * | 50 | * |
| Veo 3.1 i Shpejtë | 4 | * | 50 | * |
| Veo 3 | 4 | * | 50 | * |
| Veo 3 i Shpejtë | 4 | * | 50 | * |
| Veo 2 | 2 | * | 50 | * |
| Modele të tjera | ||||
| Gemma 3 dhe 3n | 30 | 15,000 | 14,400 | * |
| Vendosja e Binjakëve | 5,000 | 5,000,000 | * | * |
| Pamje paraprake e Gemini Robotics-ER 1.5 | 400 | 3,000,000 | 100,000 | * |
| Pamje paraprake e përdorimit të kompjuterit Gemini 2.5 | 1,000 | 5,000,000 | 50,000 | * |
| Modele të vjetruara | ||||
| Gemini 1.5 Flash (I vjetruar) | 2,000 | 4,000,000 | * | * |
| Gemini 1.5 Flash-8B (I vjetruar) | 4,000 | 4,000,000 | * | * |
| Gemini 1.5 Pro (I vjetruar) | 1,000 | 4,000,000 | * | * |
Niveli 3
| Model | RPM | TPM | RPD | Tokenët e Vendosur në Radhë të Grupit |
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Gemini 2.5 Pro | 2,000 | 8,000,000 | * | 1,000,000,000 |
| Binjakët 2.5 Flash | 10,000 | 8,000,000 | * | 1,000,000,000 |
| Pamje paraprake e flashit Gemini 2.5 | 10,000 | 8,000,000 | * | 1,000,000,000 |
| Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | * | 1,000,000,000 |
| Pamje paraprake e Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | * | 1,000,000,000 |
| Binjakët 2.0 Flash | 30,000 | 30,000,000 | * | 5,000,000,000 |
| Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | * | 5,000,000,000 |
| API i drejtpërdrejtë | ||||
| Gemini 2.5 Flash Live | 1,000 seanca | 10,000,000 | * | * |
| Parapamje paraprake e flash Gemini 2.5 Audio vendase | * | 10,000,000 | * | * |
| Gemini 2.0 Flash Live | 1,000 seanca | 10,000,000 | * | * |
| Modelet e gjenerimit multimodal | ||||
| TTS për Pamjen e Flash-it Gemini 2.5 | 1,000 | 1,000,000 | * | * |
| TTS për Pamjen e Pamjes së Gemini 2.5 Pro | 100 | 1,000,000 | * | * |
| Imazh Flash i Gemini 2.5 | 5,000 | 5,000,000 | * | * |
| Gjenerimi i imazhit paraprak të flashit Gemini 2.0 | 5,000 | 5,000,000 | * | * |
| Imazh 4 Standard/Shpejt | 20 | * | 15,000 | * |
| Imazh 4 Ultra | 15 | * | 5,000 | * |
| Imazhi 3 | 20 | * | * | * |
| Veo 3.1 | 10 | * | 500 | * |
| Veo 3.1 i Shpejtë | 10 | * | 500 | * |
| Veo 3 | 10 | * | 500 | * |
| Veo 3 i Shpejtë | 10 | * | 500 | * |
| Veo 2 | 2 | * | 50 | * |
| Modele të tjera | ||||
| Gemma 3 dhe 3n | 30 | 15,000 | 14,400 | * |
| Vendosja e Binjakëve | 10,000 | 10,000,000 | * | * |
| Pamje paraprake e Gemini Robotics-ER 1.5 | 600 | 8,000,000 | * | *1,000,000,000* |
| Pamje paraprake e përdorimit të kompjuterit Gemini 2.5 | 2,000 | 8,000,000 | * | * |
| Modele të vjetruara | ||||
| Gemini 1.5 Flash (I vjetruar) | 2,000 | 4,000,000 | * | * |
| Gemini 1.5 Flash-8B (I vjetruar) | 4,000 | 4,000,000 | * | * |
| Gemini 1.5 Pro (I vjetruar) | 1,000 | 4,000,000 | * | * |
Limitet e specifikuara të tarifave nuk janë të garantuara dhe kapaciteti aktual mund të ndryshojë.
Limitet e shpejtësisë së API-t të serisë
Kërkesat e API-t në grup i nënshtrohen kufijve të tyre të shpejtësisë, të ndara nga thirrjet API jo-në grup.
- Kërkesa të njëkohshme në grupe: 100
- Limiti i madhësisë së skedarit të futur: 2 GB
- Limiti i ruajtjes së skedarëve: 20 GB
- Tokenët e vendosur në radhë për model: Kolona Tokenët e vendosur në radhë në grup në tabelën e kufijve të shpejtësisë rendit numrin maksimal të tokenëve që mund të vendosen në radhë për përpunim në grup në të gjitha punët tuaja aktive në grup për një model të caktuar. Shihni në tabelën standarde të kufijve të shpejtësisë së API-t .
Si të përmirësoheni në nivelin tjetër
API-ja Gemini përdor Faturimin në Cloud për të gjitha shërbimet e faturimit. Për të kaluar nga niveli Falas në një nivel me pagesë, së pari duhet të aktivizoni Faturimin në Cloud për projektin tuaj në Google Cloud.
Pasi projekti juaj të përmbushë kriteret e specifikuara, ai bëhet i pranueshëm për një përmirësim në nivelin tjetër. Për të kërkuar një përmirësim, ndiqni këto hapa:
- Shko te faqja e çelësave API në AI Studio.
- Gjeni projektin që dëshironi të përmirësoni dhe klikoni "Përmirëso". Opsioni "Përmirëso" do të shfaqet vetëm për projektet që plotësojnë kualifikimet e nivelit tjetër .
Pas një validimi të shpejtë, projekti do të përmirësohet në nivelin tjetër.
Kërkoni një rritje të limitit të tarifës
Çdo variant modeli ka një limit shpejtësie të shoqëruar (kërkesa për minutë, RPM). Për detaje mbi këto limite shpejtësie, shihni modelet Gemini .
Kërkoni rritje të limitit të tarifës së paguar
Ne nuk ofrojmë asnjë garanci për rritjen e limitit tuaj të tarifës, por do të bëjmë çmos për të shqyrtuar kërkesën tuaj.