Kufijtë e tarifave

Limitet e shpejtësisë rregullojnë numrin e kërkesave që mund t'i bëni Gemini API brenda një afati kohor të caktuar. Këto kufizime ndihmojnë në ruajtjen e përdorimit të drejtë, mbrojtjen nga abuzimi dhe ndihmojnë në ruajtjen e performancës së sistemit për të gjithë përdoruesit.

Shikoni limitet tuaja të normës aktive në AI Studio

Si funksionojnë kufijtë e tarifave

Limitet e normës zakonisht maten në tre dimensione:

  • Kërkesa për minutë ( RPM )
  • Tokenë për minutë (hyrje) ( TPM )
  • Kërkesat në ditë ( RPD )

Përdorimi juaj vlerësohet kundrejt secilit limit dhe tejkalimi i ndonjërit prej tyre do të shkaktojë një gabim në limitin e shpejtësisë. Për shembull, nëse limiti juaj i RPM është 20, bërja e 21 kërkesave brenda një minute do të rezultojë në një gabim, edhe nëse nuk e keni tejkaluar TPM-në tuaj ose limite të tjera.

Limitet e shpejtësisë zbatohen për projekt, jo për çelës API. Kuotat e kërkesave në ditë ( RPD ) rivendosen në mesnatë sipas orës së Paqësorit.

Limitet ndryshojnë në varësi të modelit specifik që përdoret, dhe disa kufizime vlejnë vetëm për modele specifike. Për shembull, Imazhe për minutë, ose IPM, llogaritet vetëm për modelet e afta për të gjeneruar imazhe (Imagen 3), por është konceptualisht i ngjashëm me TPM. Modele të tjera mund të kenë një limit token për ditë (TPD).

Limitet e shpejtësisë janë më të kufizuara për modelet eksperimentale dhe ato paraprake.

Nivelet e përdorimit

Limitet e tarifave janë të lidhura me nivelin e përdorimit të projektit. Ndërsa përdorimi dhe shpenzimet e API-t tuaj rriten, do të keni mundësinë të përmirësoheni në një nivel më të lartë me limite më të larta tarifash.

Kualifikimet për Nivelet 2 dhe 3 bazohen në shpenzimet totale kumulative për shërbimet e Google Cloud (duke përfshirë, por pa u kufizuar në, Gemini API) për llogarinë e faturimit të lidhur me projektin tuaj.

Shtresa Kualifikimet
Falas Përdoruesit në vendet e përshtatshme
Niveli 1 Llogari faturimi e paguar plotësisht e lidhur me projektin
Niveli 2 Shpenzime totale: > 250 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme
Niveli 3 Shpenzime totale: > 1,000 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme

Kur kërkoni një përmirësim, sistemi ynë i automatizuar i mbrojtjes nga abuzimi kryen kontrolle shtesë. Ndërsa përmbushja e kritereve të deklaruara të kualifikimit është përgjithësisht e mjaftueshme për miratim, në raste të rralla një kërkesë për përmirësim mund të refuzohet bazuar në faktorë të tjerë të identifikuar gjatë procesit të shqyrtimit.

Ky sistem ndihmon në ruajtjen e sigurisë dhe integritetit të platformës Gemini API për të gjithë përdoruesit.

Kufijtë e normës së API-t Gemini

Limitet e tarifave varen nga një sërë faktorësh (siç është niveli juaj i kuotave) dhe mund të shihen në Google AI Studio. Ndërsa niveli dhe statusi i llogarisë suaj ndryshojnë me kalimin e kohës, limitet tuaja të tarifave do të përditësohen automatikisht.

Shikoni limitet tuaja të normës aktive në AI Studio

Limitet e specifikuara të tarifave nuk janë të garantuara dhe kapaciteti aktual mund të ndryshojë.

Limitet e shpejtësisë së API-t të serisë

Kërkesat e API-t në grup i nënshtrohen kufijve të tyre të shpejtësisë, të ndara nga thirrjet API jo-në grup.

  • Kërkesa të njëkohshme në grupe: 100
  • Limiti i madhësisë së skedarit të futur: 2 GB
  • Limiti i ruajtjes së skedarëve: 20 GB
  • Tokenët e vendosur në radhë për model: Kolona Tokenët e vendosur në radhë në grup në tabelën e kufijve të shpejtësisë rendit numrin maksimal të tokenëve që mund të vendosen në radhë për përpunim në grup në të gjitha punët tuaja aktive në grup për një model të caktuar. Shihni në tabelën standarde të kufijve të shpejtësisë së API-t .

Niveli 1

Model Tokenët e Vendosur në Radhë të Grupit
Modelet e nxjerrjes së tekstit
Pamje paraprake e Gemini 3 Pro 50,000,000
Gemini 2.5 Pro 5,000,000
Binjakët 2.5 Flash 3,000,000
Pamje paraprake e flashit Gemini 2.5 3,000,000
Gemini 2.5 Flash-Lite 10,000,000
Pamje paraprake e Gemini 2.5 Flash-Lite 10,000,000
Binjakët 2.0 Flash 10,000,000
Gemini 2.0 Flash-Lite 10,000,000
Modelet e gjenerimit multimodal
Pamje paraprake e imazhit të Gemini 3 Pro 🍌 2,000,000

Niveli 2

Model Tokenët e Vendosur në Radhë të Grupit
Modelet e nxjerrjes së tekstit
Pamje paraprake e Gemini 3 Pro 500,000,000
Gemini 2.5 Pro 500,000,000
Binjakët 2.5 Flash 400,000,000
Pamje paraprake e flashit Gemini 2.5 400,000,000
Gemini 2.5 Flash-Lite 500,000,000
Pamje paraprake e Gemini 2.5 Flash-Lite 500,000,000
Binjakët 2.0 Flash 1,000,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
Modelet e gjenerimit multimodal
Pamje paraprake e imazhit të Gemini 3 Pro 🍌 270,000,000

Niveli 3

Tokenët e Vendosur në Radhë të Grupit
Modelet e nxjerrjes së tekstit
Pamje paraprake e Gemini 3 Pro 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Binjakët 2.5 Flash 1,000,000,000
Pamje paraprake e flashit Gemini 2.5 1,000,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Pamje paraprake e Gemini 2.5 Flash-Lite 1,000,000,000
Binjakët 2.0 Flash 5,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
Modelet e gjenerimit multimodal
Pamje paraprake e imazhit të Gemini 3 Pro 🍌 5,000 5,000,000 * 1,000,000,000

Si të përmirësoheni në nivelin tjetër

API-ja Gemini përdor Faturimin në Cloud për të gjitha shërbimet e faturimit. Për të kaluar nga niveli Falas në një nivel me pagesë, së pari duhet të aktivizoni Faturimin në Cloud për projektin tuaj në Google Cloud.

Pasi projekti juaj të përmbushë kriteret e specifikuara, ai bëhet i pranueshëm për një përmirësim në nivelin tjetër. Për të kërkuar një përmirësim, ndiqni këto hapa:

Pas një validimi të shpejtë, projekti do të përmirësohet në nivelin tjetër.

Kërkoni një rritje të limitit të tarifës

Çdo variant modeli ka një limit shpejtësie të shoqëruar (kërkesa për minutë, RPM). Për detaje mbi këto limite shpejtësie, shihni modelet Gemini .

Kërkoni rritje të limitit të tarifës së paguar

Ne nuk ofrojmë asnjë garanci për rritjen e limitit tuaj të tarifës, por do të bëjmë çmos për të shqyrtuar kërkesën tuaj.