L'API Interactions est désormais en disponibilité générale. Nous vous recommandons d'utiliser cette API pour accéder à toutes les dernières fonctionnalités et tous les derniers modèles.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modèles

Gemini 3

Gemini 3.1 Pro

Intelligence avancée, compétences complexes en résolution de problèmes, et puissantes capacités de codage agentique et de style.

Aperçu

Gemini 3.5 Flash

Modèle le plus intelligent pour des performances de pointe durables sur les tâches agentiques et de codage.

Stable

Gemini 3 Flash

Performances de pointe rivalisant avec celles de modèles plus volumineux à une fraction du coût.

Aperçu

Gemini 3.1 Flash-Lite

Performances de pointe rivalisant avec celles de modèles plus volumineux à une fraction du coût.

Stable

Nano Banana 2

Génération et retouche d'images puissantes et très efficaces, optimisées pour la vitesse et les cas d'utilisation à fort volume.

Stable

Nano Banana Pro

Modèles de génération et de retouche d'images de pointe pour la création d'images natives hautement contextuelles.

Stable

Gemini 3.5 Live Translate

Modèle de traduction vocale en temps réel à faible latence compatible avec plus de 70 langues.

Nouvel aperçu

Gemini 3.1 Flash Live

Modèle d'API en direct de haute qualité et à faible latence pour les applications d'IA de dialogue et vocales en temps réel.

Nouvel aperçu

Gemini 3.1 Flash TTS

Génération vocale puissante et à faible latence.

Nouvel aperçu

Gemini 2.5 Flash

Notre modèle offrant le meilleur rapport prix/performances pour les tâches à faible latence et à fort volume nécessitant un raisonnement.

Nano Banana

Génération et retouche d'images natives de pointe conçues pour des workflows créatifs rapides.

Aperçu de Gemini 2.5 Flash Live

Optimisé pour les agents conversationnels en temps réel avec streaming audio natif inférieur à une seconde.

Aperçu de Gemini 2.5 Flash TTS

Génération audio de synthèse vocale contrôlable avec un contrôle précis du style et du rythme.

Gemini 2.5 Flash-Lite

Le modèle multimodal le plus rapide et le plus économique de la famille 2.5.

Gemini 2.5 Pro

Notre modèle le plus avancé pour les tâches complexes, avec des capacités de raisonnement et de codage approfondies.

Aperçu de Gemini 2.5 Pro TTS

Synthèse vocale haute fidélité optimisée pour la qualité dans les workflows structurés tels que les podcasts et les livres audio.

Modèles audio

Cette section contient tous les modèles audio, y compris ceux qui peuvent déjà être listés dans d'autres sections.

Aperçu de Gemini 3.1 Flash Live

Notre modèle audio-vers-audio (A2A) de haute qualité et à faible latence conçu pour les applications d'IA de dialogue et vocales en temps réel.

Aperçu de Gemini 3.1 Flash TTS

Génération vocale puissante et à faible latence, avec des sorties naturelles, des invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.

Aperçu de Gemini 2.5 Flash Live

Notre modèle d'API en direct phare pour les agents vocaux et vidéo bidirectionnels à faible latence avec raisonnement audio natif.

Aperçu de Gemini 2.5 Flash TTS

Synthèse vocale rapide et contrôlable pour les applications à faible latence et économiques, et les assistants en temps réel.

Aperçu de Gemini 2.5 Pro TTS

Synthèse vocale haute fidélité optimisée pour la qualité dans les workflows structurés tels que les podcasts et les livres audio.

Modèles de média génératif

Cette section contient tous les modèles de média génératif, y compris ceux qui peuvent déjà être listés dans d'autres sections.

Nano Banana 2

Création visuelle à grande échelle et très efficace, combinant l'intelligence de la série Gemini 3 avec des vitesses de génération ultra-rapides.

Aperçu de Veo 3.1

Génération vidéo cinématographique de pointe avec des commandes créatives avancées et un son synchronisé en mode natif.

Nano Banana Pro

Moteur de conception professionnel avec un cœur de raisonnement pour des visuels 4K de qualité studio, des mises en page complexes et un rendu de texte précis.

Aperçu de Veo 3.1 Lite

Génération, retouche et contrôle cinématographique de vidéos très efficaces, à faible coût et axés sur les développeurs de la famille Veo 3.1.

Nano Banana

Génération et retouche d'images natives de pointe conçues pour des workflows créatifs rapides.

Imagen 4

Modèle de texte vers image, avec une génération rapide et ultra-rapide, et une clarté exceptionnelle jusqu'à une résolution de 2K.

Modèles de génération de musique

Cette section contient tous les modèles de génération de musique, y compris ceux qui peuvent déjà être listés dans d'autres sections.

Aperçu de Lyria 3 Pro

Notre modèle de génération de musique phare, optimisé pour les chansons complètes avec une cohérence structurelle complexe.

Aperçu de Lyria 3 Clip

Optimisé pour générer des clips musicaux courts, des boucles et des aperçus de 30 secondes maximum.

Lyria RealTime (expérimental)

Modèle de génération de musique haute fidélité offrant un contrôle créatif précis et des capacités de streaming en temps réel.

Modèles d'outils et d'agents

Aperçu de l'utilisation de l'ordinateur

Modèle spécialisé capable de "voir" un écran numérique et d'effectuer des actions d'interface utilisateur telles que cliquer, taper et naviguer pour automatiser des tâches de navigateur complexes.

Aperçu de Gemini Deep Research

Modèle agentique qui planifie et exécute de manière autonome des recherches en plusieurs étapes sur des centaines de sources pour produire des rapports interactifs cités.

Aperçu de Gemini Deep Research Max

Exhaustivité maximale pour la collecte et la synthèse automatisées de contexte à partir de centaines de sources.

Aperçu de l'agent Antigravity

Agent géré à usage général qui planifie, raisonne, exécute du code, gère des fichiers et navigue sur le Web de manière autonome dans un bac à sable Linux sécurisé et isolé.

Modèles de tâches spécialisées

Gemini Embedding 2

Notre premier modèle d'embedding multimodal, qui mappe le texte, les images, les vidéos, l'audio et les PDF dans un espace d'embedding unifié pour la recherche sémantique avancée et les systèmes RAG.

Gemini Embedding

Représentations vectorielles de haute dimension pour la recherche sémantique avancée, la classification de texte et les systèmes RAG.

Aperçu de Gemini Robotics-ER 1.6

Modèle de raisonnement incarné avancé qui comprend les espaces physiques et planifie des tâches en plusieurs étapes pour les agents robotiques avec de nouvelles fonctionnalités telles que la lecture d'instruments, un raisonnement spatial et physique amélioré.

Modèles précédents

Arrêt de Gemini 2.0 Flash

Notre modèle de travail de deuxième génération, avec des fonctionnalités de nouvelle génération et des capacités améliorées, y compris une vitesse supérieure, l'utilisation d'outils natifs et une fenêtre de contexte d'un million de jetons.

Arrêt de Gemini 2.0 Flash-Lite

Notre modèle de deuxième génération le plus rapide, optimisé pour l'efficacité des coûts et la faible latence.

Aperçu de Gemini 3.1 Flash-Lite Éteindre

Notre modèle multimodal le plus économique, offrant les performances les plus rapides pour les tâches légères à haute fréquence.

Aperçu de Gemini 3 Pro Éteindre

Notre modèle de raisonnement de pointe, avec une compréhension multimodale avancée.

Modèles de noms de versions de modèles

Les modèles Gemini sont disponibles dans les versions stable, preview, latest ou experimental.

Stable

Pointe vers un modèle stable spécifique. Les modèles stables ne changent généralement pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

Exemple : gemini-3.5-flash.

Aperçu

Pointe vers un modèle en aperçu qui peut être utilisé en production. La facturation est généralement activée pour les modèles en aperçu, qui peuvent être soumis à des limites de débit plus restrictives et qui seront abandonnés avec un préavis d'au moins deux semaines.

Exemple : gemini-2.5-flash-preview-09-2025.

Les plus récents

Pointe vers la dernière version d'une variante de modèle spécifique. Il peut s'agir d'une version stable, en aperçu ou expérimentale. Cet alias sera remplacé à chaud à chaque nouvelle version d'une variante de modèle spécifique. Un préavis de deux semaines sera envoyé par e-mail avant le changement de version.

Exemple : gemini-flash-latest.

Expérimental

Pointe vers un modèle expérimental qui ne convient généralement pas à une utilisation en production et qui est soumis à des limites de débit plus restrictives. Nous publions des modèles expérimentaux pour recueillir des commentaires et mettre rapidement nos dernières mises à jour à la disposition des développeurs.

Les modèles expérimentaux ne sont pas stables et la disponibilité des points de terminaison des modèles est susceptible de changer.

Abandons de modèles

Pour en savoir plus sur les abandons de modèles, consultez la page Abandons de Gemini.