Explorer les fonctionnalités audio de l'API Gemini
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
<ph type="x-smartling-placeholder"></ph>
Gemini peut répondre aux requêtes concernant l'audio. Par exemple, Gemini peut:
Décrivez le contenu audio, résumez-le ou répondez à des questions le concernant.
Fournissez une transcription de l'audio.
Fournissez des réponses ou une transcription concernant un segment spécifique de l'audio.
Ce guide présente différentes façons de:
Transmettre des données audio à un modèle Gemini.
Envoyez une requête au modèle Gemini concernant l'audio.
Formats audio compatibles
Gemini est compatible avec les types MIME du format audio suivants:
WAV – audio/wav
MP3 (audio/mp3)
AIFF : audio/aiff
AAC : audio/aac
OGG Vorbis – audio/ogg
FLAC (audio/flac)
Détails techniques concernant l'audio
Gemini impose les règles suivantes concernant l'audio:
Gemini représente chaque seconde de l'audio sous forme de 25 jetons. Exemple :
une minute de son correspond à 1 500 jetons.
Gemini ne peut déduire que les réponses prononcées en anglais.
Gemini peut "comprendre" composants autres que la parole, comme le chant d'oiseau ou les sirènes.
La durée maximale autorisée pour les données audio dans une seule requête est de 9,5 heures.
Gemini ne limite pas le nombre de fichiers audio dans une même requête. Toutefois,
la longueur totale combinée de tous les fichiers audio dans une même requête ne peut pas dépasser
9,5 heures.
Gemini sous-échantillonne les fichiers audio à une résolution de données de 16 kbit/s.
Si la source audio contient plusieurs canaux, Gemini les combine
à un seul canal.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/09/03 (UTC).
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"Il n'y a pas l'information dont j'ai besoin"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"Trop compliqué/Trop d'étapes"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"Obsolète"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"Problème de traduction"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"Mauvais exemple/Erreur de code"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"Autre"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"Facile à comprendre"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"J'ai pu résoudre mon problème"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"Autre"
}]
{"lastModified": "Derni\u00e8re mise \u00e0 jour le 2024/09/03\u00a0(UTC)."}
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2024/09/03 (UTC)."],[],[]]