Kufijtë e tarifave

Limitet e shpejtësisë rregullojnë numrin e kërkesave që mund t'i bëni Gemini API brenda një afati kohor të caktuar. Këto kufizime ndihmojnë në ruajtjen e përdorimit të drejtë, mbrojtjen nga abuzimi dhe ndihmojnë në ruajtjen e performancës së sistemit për të gjithë përdoruesit.

Shikoni limitet tuaja të normës aktive në AI Studio

Si funksionojnë kufijtë e tarifave

Limitet e normës zakonisht maten në tre dimensione:

  • Kërkesa për minutë ( RPM )
  • Tokenë për minutë (hyrje) ( TPM )
  • Kërkesat në ditë ( RPD )

Përdorimi juaj vlerësohet kundrejt secilit limit dhe tejkalimi i ndonjërit prej tyre do të shkaktojë një gabim në limitin e shpejtësisë. Për shembull, nëse limiti juaj i RPM është 20, bërja e 21 kërkesave brenda një minute do të rezultojë në një gabim, edhe nëse nuk e keni tejkaluar TPM-në tuaj ose limite të tjera.

Limitet e normës zbatohen për çdo projekt, jo për çdo çelës API.

Kuotat e kërkesave në ditë ( RPD ) rivendosen në mesnatë sipas kohës së Paqësorit.

Limitet ndryshojnë në varësi të modelit specifik që përdoret, dhe disa kufizime vlejnë vetëm për modele specifike. Për shembull, Imazhe për minutë, ose IPM, llogaritet vetëm për modelet e afta për të gjeneruar imazhe (Imagen 3), por është konceptualisht i ngjashëm me TPM. Modele të tjera mund të kenë një limit token për ditë (TPD).

Limitet e shpejtësisë janë më të kufizuara për modelet eksperimentale dhe ato paraprake.

Nivelet e përdorimit

Limitet e tarifave janë të lidhura me nivelin e përdorimit të projektit. Ndërsa përdorimi dhe shpenzimet e API-t tuaj rriten, do të keni mundësinë të përmirësoheni në një nivel më të lartë me limite më të larta tarifash.

Kualifikimet për Nivelet 2 dhe 3 bazohen në shpenzimet totale kumulative për shërbimet e Google Cloud (duke përfshirë, por pa u kufizuar në, Gemini API) për llogarinë e faturimit të lidhur me projektin tuaj.

Shtresa Kualifikimet
Falas Përdoruesit në vendet e përshtatshme
Niveli 1 Llogaria e faturimit e lidhur me projektin
Niveli 2 Shpenzime totale: > 250 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme
Niveli 3 Shpenzime totale: > 1,000 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme

Kur kërkoni një përmirësim, sistemi ynë i automatizuar i mbrojtjes nga abuzimi kryen kontrolle shtesë. Ndërsa përmbushja e kritereve të deklaruara të kualifikimit është përgjithësisht e mjaftueshme për miratim, në raste të rralla një kërkesë për përmirësim mund të refuzohet bazuar në faktorë të tjerë të identifikuar gjatë procesit të shqyrtimit.

Ky sistem ndihmon në ruajtjen e sigurisë dhe integritetit të platformës Gemini API për të gjithë përdoruesit.

Limitet standarde të normës së API-t

Tabela e mëposhtme rendit kufijtë e tarifave për të gjitha thirrjet standarde të Gemini API.

Niveli i Lirë

Model RPM TPM RPD
Modelet e nxjerrjes së tekstit
Gemini 2.5 Pro 5 125,000 100
Binjakët 2.5 Flash 10 250,000 250
Pamje paraprake e flashit Gemini 2.5 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Pamje paraprake e Gemini 2.5 Flash-Lite 15 250,000 1,000
Binjakët 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
API i drejtpërdrejtë
Gemini 2.5 Flash Live * 1,000,000 *
Parapamje paraprake e flash Gemini 2.5 Audio vendase * 500,000 *
Gemini 2.0 Flash Live * 1,000,000 *
Modelet e gjenerimit multimodal
TTS për Pamjen e Flash-it Gemini 2.5 3 10,000 15
Gjenerimi i imazhit paraprak të flashit Gemini 2.0 10 200,000 100
Modele të tjera
Gemma 3 dhe 3n 30 15,000 14,400
Vendosja e Binjakëve 100 30,000 1,000
Pamje paraprake e Gemini Robotics-ER 1.5 10 250,000 250
Modele të vjetruara
Gemini 1.5 Flash (I vjetruar) 15 250,000 50
Gemini 1.5 Flash-8B (I vjetruar) 15 250,000 50

Niveli 1

Model RPM TPM RPD Tokenët e Vendosur në Radhë të Grupit
Modelet e nxjerrjes së tekstit
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Binjakët 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Pamje paraprake e flashit Gemini 2.5 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Pamje paraprake e Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Binjakët 2.0 Flash 2,000 4,000,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * 10,000,000
API i drejtpërdrejtë
Gemini 2.5 Flash Live 50 seanca 4,000,000 * *
Parapamje paraprake e flash Gemini 2.5 Audio vendase * 1,000,000 * *
Gemini 2.0 Flash Live 50 seanca 4,000,000 * *
Modelet e gjenerimit multimodal
TTS për Pamjen e Flash-it Gemini 2.5 10 10,000 100 *
TTS për Pamjen e Pamjes së Gemini 2.5 Pro 10 10,000 50 *
Imazh Flash i Gemini 2.5 500 500,000 2,000 *
Gjenerimi i imazhit paraprak të flashit Gemini 2.0 1,000 1,000,000 10,000 *
Imazh 4 Standard/Shpejt 10 * 70 *
Imazh 4 Ultra 5 * 30 *
Imazhi 3 20 * * *
Veo 3.1 2 * 10 *
Veo 3.1 i Shpejtë 2 * 10 *
Veo 3 2 * 10 *
Veo 3 i Shpejtë 2 * 10 *
Veo 2 2 * 50 *
Modele të tjera
Gemma 3 dhe 3n 30 15,000 14,400 *
Vendosja e Binjakëve 3,000 1,000,000 * *
Pamje paraprake e Gemini Robotics-ER 1.5 300 1,000,000 10,000 *
Pamje paraprake e përdorimit të kompjuterit Gemini 2.5 150 2,000,000 10,000 *
Modele të vjetruara
Gemini 1.5 Flash (I vjetruar) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (I vjetruar) 4,000 4,000,000 * *
Gemini 1.5 Pro (I vjetruar) 1,000 4,000,000 * *

Niveli 2

Model RPM TPM RPD Tokenët e Vendosur në Radhë të Grupit
Modelet e nxjerrjes së tekstit
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Binjakët 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Pamje paraprake e flashit Gemini 2.5 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Pamje paraprake e Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Binjakët 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
API i drejtpërdrejtë
Gemini 2.5 Flash Live 1,000 seanca 10,000,000 * *
Parapamje paraprake e flash Gemini 2.5 Audio vendase * 10,000,000 * *
Gemini 2.0 Flash Live 1,000 seanca 10,000,000 * *
Modelet e gjenerimit multimodal
TTS për Pamjen e Flash-it Gemini 2.5 1,000 100,000 10,000 *
TTS për Pamjen e Pamjes së Gemini 2.5 Pro 100 25,000 1,000 *
Imazh Flash i Gemini 2.5 2,000 1,500,000 50,000 *
Gjenerimi i imazhit paraprak të flashit Gemini 2.0 2,000 3,000,000 100,000 *
Imazh 4 Standard/Shpejt 15 * 1000 *
Imazh 4 Ultra 10 * 400 *
Imazhi 3 20 * * *
Veo 3.1 4 * 50 *
Veo 3.1 i Shpejtë 4 * 50 *
Veo 3 4 * 50 *
Veo 3 i Shpejtë 4 * 50 *
Veo 2 2 * 50 *
Modele të tjera
Gemma 3 dhe 3n 30 15,000 14,400 *
Vendosja e Binjakëve 5,000 5,000,000 * *
Pamje paraprake e Gemini Robotics-ER 1.5 400 3,000,000 100,000 *
Pamje paraprake e përdorimit të kompjuterit Gemini 2.5 1,000 5,000,000 50,000 *
Modele të vjetruara
Gemini 1.5 Flash (I vjetruar) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (I vjetruar) 4,000 4,000,000 * *
Gemini 1.5 Pro (I vjetruar) 1,000 4,000,000 * *

Niveli 3

Model RPM TPM RPD Tokenët e Vendosur në Radhë të Grupit
Modelet e nxjerrjes së tekstit
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Binjakët 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Pamje paraprake e flashit Gemini 2.5 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Pamje paraprake e Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Binjakët 2.0 Flash 30,000 30,000,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * 5,000,000,000
API i drejtpërdrejtë
Gemini 2.5 Flash Live 1,000 seanca 10,000,000 * *
Parapamje paraprake e flash Gemini 2.5 Audio vendase * 10,000,000 * *
Gemini 2.0 Flash Live 1,000 seanca 10,000,000 * *
Modelet e gjenerimit multimodal
TTS për Pamjen e Flash-it Gemini 2.5 1,000 1,000,000 * *
TTS për Pamjen e Pamjes së Gemini 2.5 Pro 100 1,000,000 * *
Imazh Flash i Gemini 2.5 5,000 5,000,000 * *
Gjenerimi i imazhit paraprak të flashit Gemini 2.0 5,000 5,000,000 * *
Imazh 4 Standard/Shpejt 20 * 15,000 *
Imazh 4 Ultra 15 * 5,000 *
Imazhi 3 20 * * *
Veo 3.1 10 * 500 *
Veo 3.1 i Shpejtë 10 * 500 *
Veo 3 10 * 500 *
Veo 3 i Shpejtë 10 * 500 *
Veo 2 2 * 50 *
Modele të tjera
Gemma 3 dhe 3n 30 15,000 14,400 *
Vendosja e Binjakëve 10,000 10,000,000 * *
Pamje paraprake e Gemini Robotics-ER 1.5 600 8,000,000 * *1,000,000,000*
Pamje paraprake e përdorimit të kompjuterit Gemini 2.5 2,000 8,000,000 * *
Modele të vjetruara
Gemini 1.5 Flash (I vjetruar) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (I vjetruar) 4,000 4,000,000 * *
Gemini 1.5 Pro (I vjetruar) 1,000 4,000,000 * *

Limitet e specifikuara të tarifave nuk janë të garantuara dhe kapaciteti aktual mund të ndryshojë.

Limitet e shpejtësisë së API-t të serisë

Kërkesat e API-t në grup i nënshtrohen kufijve të tyre të shpejtësisë, të ndara nga thirrjet API jo-në grup.

  • Kërkesa të njëkohshme në grupe: 100
  • Limiti i madhësisë së skedarit të futur: 2 GB
  • Limiti i ruajtjes së skedarëve: 20 GB
  • Tokenët e vendosur në radhë për model: Kolona Tokenët e vendosur në radhë në grup në tabelën e kufijve të shpejtësisë rendit numrin maksimal të tokenëve që mund të vendosen në radhë për përpunim në grup në të gjitha punët tuaja aktive në grup për një model të caktuar. Shihni në tabelën standarde të kufijve të shpejtësisë së API-t .

Si të përmirësoheni në nivelin tjetër

API-ja Gemini përdor Faturimin në Cloud për të gjitha shërbimet e faturimit. Për të kaluar nga niveli Falas në një nivel me pagesë, së pari duhet të aktivizoni Faturimin në Cloud për projektin tuaj në Google Cloud.

Pasi projekti juaj të përmbushë kriteret e specifikuara, ai bëhet i pranueshëm për një përmirësim në nivelin tjetër. Për të kërkuar një përmirësim, ndiqni këto hapa:

  • Shko te faqja e çelësave API në AI Studio.
  • Gjeni projektin që dëshironi të përmirësoni dhe klikoni "Përmirëso". Opsioni "Përmirëso" do të shfaqet vetëm për projektet që plotësojnë kualifikimet e nivelit tjetër .

Pas një validimi të shpejtë, projekti do të përmirësohet në nivelin tjetër.

Kërkoni një rritje të limitit të tarifës

Çdo variant modeli ka një limit shpejtësie të shoqëruar (kërkesa për minutë, RPM). Për detaje mbi këto limite shpejtësie, shihni modelet Gemini .

Kërkoni rritje të limitit të tarifës së paguar

Ne nuk ofrojmë asnjë garanci për rritjen e limitit tuaj të tarifës, por do të bëjmë çmos për të shqyrtuar kërkesën tuaj.