Limitet e shpejtësisë rregullojnë numrin e kërkesave që mund t'i bëni Gemini API brenda një afati kohor të caktuar. Këto kufizime ndihmojnë në ruajtjen e përdorimit të drejtë, mbrojtjen nga abuzimi dhe ndihmojnë në ruajtjen e performancës së sistemit për të gjithë përdoruesit.
Shikoni limitet tuaja të normës aktive në AI Studio
Si funksionojnë kufijtë e tarifave
Limitet e normës zakonisht maten në tre dimensione:
- Kërkesa për minutë ( RPM )
- Tokenë për minutë (hyrje) ( TPM )
- Kërkesat në ditë ( RPD )
Përdorimi juaj vlerësohet kundrejt secilit limit dhe tejkalimi i ndonjërit prej tyre do të shkaktojë një gabim në limitin e shpejtësisë. Për shembull, nëse limiti juaj i RPM është 20, bërja e 21 kërkesave brenda një minute do të rezultojë në një gabim, edhe nëse nuk e keni tejkaluar TPM-në tuaj ose limite të tjera.
Limitet e shpejtësisë zbatohen për projekt, jo për çelës API. Kuotat e kërkesave në ditë ( RPD ) rivendosen në mesnatë sipas orës së Paqësorit.
Limitet ndryshojnë në varësi të modelit specifik që përdoret, dhe disa kufizime vlejnë vetëm për modele specifike. Për shembull, Imazhe për minutë, ose IPM, llogaritet vetëm për modelet e afta për të gjeneruar imazhe (Imagen 3), por është konceptualisht i ngjashëm me TPM. Modele të tjera mund të kenë një limit token për ditë (TPD).
Limitet e shpejtësisë janë më të kufizuara për modelet eksperimentale dhe ato paraprake.
Nivelet e përdorimit
Limitet e tarifave janë të lidhura me nivelin e përdorimit të projektit. Ndërsa përdorimi dhe shpenzimet e API-t tuaj rriten, do të keni mundësinë të përmirësoheni në një nivel më të lartë me limite më të larta tarifash.
Kualifikimet për Nivelet 2 dhe 3 bazohen në shpenzimet totale kumulative për shërbimet e Google Cloud (duke përfshirë, por pa u kufizuar në, Gemini API) për llogarinë e faturimit të lidhur me projektin tuaj.
| Shtresa | Kualifikimet |
|---|---|
| Falas | Përdoruesit në vendet e përshtatshme |
| Niveli 1 | Llogari faturimi e paguar plotësisht e lidhur me projektin |
| Niveli 2 | Shpenzime totale: > 250 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme |
| Niveli 3 | Shpenzime totale: > 1,000 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme |
Kur kërkoni një përmirësim, sistemi ynë i automatizuar i mbrojtjes nga abuzimi kryen kontrolle shtesë. Ndërsa përmbushja e kritereve të deklaruara të kualifikimit është përgjithësisht e mjaftueshme për miratim, në raste të rralla një kërkesë për përmirësim mund të refuzohet bazuar në faktorë të tjerë të identifikuar gjatë procesit të shqyrtimit.
Ky sistem ndihmon në ruajtjen e sigurisë dhe integritetit të platformës Gemini API për të gjithë përdoruesit.
Kufijtë e normës së API-t Gemini
Limitet e tarifave varen nga një sërë faktorësh (siç është niveli juaj i kuotave) dhe mund të shihen në Google AI Studio. Ndërsa niveli dhe statusi i llogarisë suaj ndryshojnë me kalimin e kohës, limitet tuaja të tarifave do të përditësohen automatikisht.
Shikoni limitet tuaja të normës aktive në AI Studio
Limitet e specifikuara të tarifave nuk janë të garantuara dhe kapaciteti aktual mund të ndryshojë.
Limitet e shpejtësisë së API-t të serisë
Kërkesat e API-t në grup i nënshtrohen kufijve të tyre të shpejtësisë, të ndara nga thirrjet API jo-në grup.
- Kërkesa të njëkohshme në grupe: 100
- Limiti i madhësisë së skedarit të futur: 2 GB
- Limiti i ruajtjes së skedarëve: 20 GB
- Tokenët e vendosur në radhë për model: Kolona Tokenët e vendosur në radhë në grup në tabelën e kufijve të shpejtësisë rendit numrin maksimal të tokenëve që mund të vendosen në radhë për përpunim në grup në të gjitha punët tuaja aktive në grup për një model të caktuar. Shihni në tabelën standarde të kufijve të shpejtësisë së API-t .
Niveli 1
| Model | Tokenët e Vendosur në Radhë të Grupit | |||
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Pamje paraprake e Gemini 3 Pro | 50,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Binjakët 2.5 Flash | 3,000,000 | |||
| Pamje paraprake e flashit Gemini 2.5 | 3,000,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Pamje paraprake e Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Binjakët 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| Modelet e gjenerimit multimodal | ||||
| Pamje paraprake e imazhit të Gemini 3 Pro 🍌 | 2,000,000 | |||
Niveli 2
| Model | Tokenët e Vendosur në Radhë të Grupit | |||
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Pamje paraprake e Gemini 3 Pro | 500,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Binjakët 2.5 Flash | 400,000,000 | |||
| Pamje paraprake e flashit Gemini 2.5 | 400,000,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Pamje paraprake e Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Binjakët 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| Modelet e gjenerimit multimodal | ||||
| Pamje paraprake e imazhit të Gemini 3 Pro 🍌 | 270,000,000 | |||
Niveli 3
| Tokenët e Vendosur në Radhë të Grupit | ||||
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Pamje paraprake e Gemini 3 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Binjakët 2.5 Flash | 1,000,000,000 | |||
| Pamje paraprake e flashit Gemini 2.5 | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Pamje paraprake e Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Binjakët 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| Modelet e gjenerimit multimodal | ||||
| Pamje paraprake e imazhit të Gemini 3 Pro 🍌 | 5,000 | 5,000,000 | * | 1,000,000,000 |
Si të përmirësoheni në nivelin tjetër
API-ja Gemini përdor Faturimin në Cloud për të gjitha shërbimet e faturimit. Për të kaluar nga niveli Falas në një nivel me pagesë, së pari duhet të aktivizoni Faturimin në Cloud për projektin tuaj në Google Cloud.
Pasi projekti juaj të përmbushë kriteret e specifikuara, ai bëhet i pranueshëm për një përmirësim në nivelin tjetër. Për të kërkuar një përmirësim, ndiqni këto hapa:
- Shko te faqja e çelësave API në AI Studio.
- Gjeni projektin që dëshironi të përmirësoni dhe klikoni "Përmirëso". Opsioni "Përmirëso" do të shfaqet vetëm për projektet që plotësojnë kualifikimet e nivelit tjetër .
Pas një validimi të shpejtë, projekti do të përmirësohet në nivelin tjetër.
Kërkoni një rritje të limitit të tarifës
Çdo variant modeli ka një limit shpejtësie të shoqëruar (kërkesa për minutë, RPM). Për detaje mbi këto limite shpejtësie, shihni modelet Gemini .
Kërkoni rritje të limitit të tarifës së paguar
Ne nuk ofrojmë asnjë garanci për rritjen e limitit tuaj të tarifës, por do të bëjmë çmos për të shqyrtuar kërkesën tuaj.