L'API Interactions est désormais en disponibilité générale. Nous vous recommandons d'utiliser cette API pour accéder à toutes les dernières fonctionnalités et tous les derniers modèles.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modèles

Gemini 3

Stable

Gemini 3.5 Flash

Modèle le plus intelligent pour des performances de pointe durables sur les tâches agentiques et de codage.

Stable

Gemini 3.1 Flash-Lite

Des performances de pointe rivalisant avec celles des modèles plus grands, pour un coût bien inférieur.

Stable

Nano Banana 2

Génération et retouche d'images puissantes et très efficaces, optimisées pour la vitesse et les cas d'utilisation à fort volume.

Stable

Nano Banana Lite

Génération et retouche d'images à latence ultra-faible et économiques, conçues pour les cas d'utilisation interactifs à volume élevé.

Stable

Nano Banana Pro

Modèles de pointe pour la génération et la retouche d'images permettant de créer des images natives très contextuelles.

Stable

Aperçu

Gemini 3.1 Pro

Intelligence avancée, compétences en résolution de problèmes complexes, et puissantes capacités de codage agentique et d'ambiance.

Aperçu

Gemini 3 Flash

Des performances de pointe rivalisant avec celles des modèles plus grands, pour un coût bien inférieur.

Aperçu

Gemini 3.5 Live Translate

Modèle de traduction vocale en temps réel à faible latence, compatible avec plus de 70 langues.

Nouveau : Aperçu

Gemini 3.1 Flash Live

Modèle d'API Live de haute qualité et à faible latence pour les applications d'IA vocales et de dialogue en temps réel.

Nouveau : Aperçu

Gemini 3.1 Flash TTS

Génération vocale puissante et à faible latence.

Nouveau : Aperçu

Gemini Omni Flash

Génération et montage de vidéos rapides et conversationnels. Transformez du texte et des images en vidéos, et affinez les résultats en langage naturel.

Nouveau : Aperçu

Gemini 2.0 Flash

Gemini 2.5 Flash

Notre modèle offrant le meilleur rapport prix-performances pour les tâches à faible latence et à fort volume nécessitant un raisonnement.

Nano Banana

Génération et retouche d'images natives de pointe conçues pour des workflows créatifs rapides.

Gemini 2.5 Flash Live (preview)

Optimisé pour les agents conversationnels en temps réel avec streaming audio natif en moins d'une seconde.

Gemini 2.5 Flash TTS (preview)

Génération audio de synthèse vocale contrôlable avec un contrôle précis du style et du rythme.

Gemini 2.5 Flash-Lite

Le modèle multimodal le plus rapide et le plus économique de la famille 2.5.

Gemini 2.5 Pro

Notre modèle le plus avancé pour les tâches complexes, doté de capacités de raisonnement et de codage approfondies.

Gemini 2.5 Pro TTS (preview)

Synthèse vocale haute fidélité optimisée pour la qualité dans les workflows structurés tels que les podcasts et les livres audio.

Modèles audio

Cette section contient tous les modèles audio, y compris ceux qui peuvent déjà figurer dans d'autres sections.

Gemini 3.1 Flash Live (preview)

Notre modèle audio à audio (A2A) de haute qualité et à faible latence est conçu pour les applications d'IA vocales et de dialogue en temps réel.

Gemini 3.1 Flash TTS Preview

Génération vocale puissante et à faible latence, avec des sorties naturelles, des invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.

Gemini 2.5 Flash Live (preview)

Notre modèle d'API Live phare pour les agents vocaux et vidéo bidirectionnels à faible latence avec raisonnement audio natif.

Gemini 2.5 Flash TTS (preview)

Synthèse vocale rapide et contrôlable pour les applications à faible latence et économiques, et les assistants en temps réel.

Gemini 2.5 Pro TTS (preview)

Synthèse vocale haute fidélité optimisée pour la qualité dans les workflows structurés tels que les podcasts et les livres audio.

Modèles de génération de contenus multimédias

Cette section contient tous les modèles de médias génératifs, y compris ceux qui peuvent déjà figurer dans d'autres sections.

Nano Banana 2

Création visuelle à l'échelle de la production, à haute efficacité, combinant l'intelligence de la gamme Gemini 3 à des vitesses de génération ultra-rapides.

Nano Banana Lite

Conçu comme le spécialiste de l'efficacité de la famille de modèles de génération d'images, il offre une latence ultra-faible et une génération et retouche d'images économiques.

Veo 3.1 Aperçu

Génération de vidéos cinématiques de pointe avec des commandes créatives avancées et un son synchronisé de manière native.

Nano Banana Pro

Moteur de conception professionnel avec un cœur de raisonnement pour des visuels 4K de qualité studio, des mises en page complexes et un rendu de texte précis.

Veo 3.1 Lite Aperçu

Génération et montage vidéo très efficaces et à faible coût, et contrôle cinématographique de la famille Veo 3.1, conçus pour les développeurs.

Gemini Omni Flash Preview

Génération et montage de vidéos rapides et conversationnels. Transformez du texte et des images en vidéos, et affinez les résultats en langage naturel.

Nano Banana

Génération et retouche d'images natives de pointe conçues pour des workflows créatifs rapides.

Imagen 4 Obsolète

Modèle texte-vers-image, avec une génération rapide et ultra-rapide, et une clarté exceptionnelle jusqu'à la résolution 2K.

Modèles de génération de musique

Cette section contient tous les modèles de génération de musique, y compris ceux qui peuvent déjà figurer dans d'autres sections.

Lyria 3 Pro Preview

Notre modèle phare de génération de musique, optimisé pour les titres complets avec une cohérence structurelle complexe.

Lyria 3 Clip Preview

Optimisé pour générer de courts extraits musicaux, des boucles et des aperçus de 30 secondes maximum.

Lyria RealTime (expérimental)

Modèle de génération de musique haute fidélité offrant un contrôle créatif précis et des capacités de streaming en temps réel.

Modèles d'outils et d'agents

Utilisation de l'ordinateur Aperçu

Modèle spécialisé capable de "voir" un écran numérique et d'effectuer des actions d'interface utilisateur telles que cliquer, saisir du texte et naviguer pour automatiser des tâches complexes dans le navigateur.

Gemini Deep Research (aperçu)

Un modèle agentique qui planifie et exécute de manière autonome des recherches en plusieurs étapes dans des centaines de sources pour produire des rapports interactifs avec des citations.

Gemini Deep Research Max Aperçu

Exhaustivité maximale pour la collecte et la synthèse automatisées du contexte à partir de centaines de sources.

Agent Antigravity Preview

Agent géré à usage général qui planifie, raisonne, exécute du code, gère des fichiers et navigue sur le Web de manière autonome dans un bac à sable Linux sécurisé et isolé.

Modèles de tâches spécialisés

Gemini Embedding 2

Notre premier modèle d'embedding multimodal, qui mappe le texte, les images, les vidéos, l'audio et les PDF dans un espace d'embedding unifié pour les systèmes de recherche sémantique avancée et de RAG.

Gemini Embedding

Représentations vectorielles de grande dimension pour la recherche sémantique avancée, la classification de texte et les systèmes RAG.

Gemini Robotics-ER 1.6Preview

Modèle de raisonnement avancé qui comprend les espaces physiques et planifie des tâches en plusieurs étapes pour les agents robotiques, avec de nouvelles fonctionnalités telles que la lecture d'instruments et l'amélioration du raisonnement spatial et physique.

Modèles précédents

Gemini 2.0 Flash Arrêt

Notre modèle de deuxième génération, avec des fonctionnalités de nouvelle génération et des capacités améliorées, y compris une vitesse supérieure, l'utilisation d'outils natifs et une fenêtre de contexte d'un million de jetons.

Gemini 2.0 Flash-Lite Arrêter

Notre modèle de deuxième génération le plus rapide, optimisé pour la rentabilité et la faible latence.

Preview Gemini 3.1 Flash-Lite Éteindre

Notre modèle multimodal le plus économique, qui offre les performances les plus rapides pour les tâches légères et à haute fréquence.

Preview Gemini 3 Pro Éteindre

Notre modèle de raisonnement de pointe, avec une compréhension multimodale avancée.

Schémas de nom de version de modèle

Les modèles Gemini sont disponibles en versions stable, preview, latest ou experimental.

Stable

Pointe vers un modèle stable spécifique. Les modèles stables ne changent généralement pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

Exemple : gemini-3.5-flash.

Aperçu

Pointe vers un modèle d'aperçu qui peut être utilisé en production. La facturation est généralement activée pour les modèles en version Preview. Ils peuvent être soumis à des limites de débit plus restrictives et seront abandonnés avec un préavis d'au moins deux semaines.

Exemple : gemini-2.5-flash-preview-09-2025.

Les plus récents

Pointe vers la dernière version d'une variante de modèle spécifique. Il peut s'agir d'une version stable, preview ou expérimentale. Cet alias sera remplacé à chaud à chaque nouvelle version d'une variante de modèle spécifique. Un préavis de deux semaines sera envoyé par e-mail avant que la version antérieure à la dernière ne soit modifiée.

Exemple : gemini-flash-latest.

Version expérimentale

Pointe vers un modèle expérimental qui ne convient généralement pas à une utilisation en production et qui est soumis à des limites de fréquence plus restrictives. Nous publions des modèles expérimentaux pour recueillir des commentaires et mettre rapidement nos dernières mises à jour à la disposition des développeurs.

Les modèles expérimentaux ne sont pas stables et la disponibilité des points de terminaison des modèles peut changer.

Abandons de modèles

Pour en savoir plus sur l'abandon des modèles, consultez la page Abandons de Gemini.