Gemini 1.5 Flash の値下げ、すべてのデベロッパー向けのファインチューニング アクセスなど
詳細
Gemini API を使用した音声機能の詳細
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
<ph type="x-smartling-placeholder"></ph>
Gemini は音声に関するプロンプトに応答できます。たとえば、Gemini は次のことができます。
- 音声コンテンツについて説明、要約、質問に回答する。
- 音声の音声文字変換を提供します。
- 音声の特定部分に関する回答や音声文字変換を提供します。
で確認できます。
このガイドでは、以下のさまざまな方法について説明します。
- Gemini モデルに音声を渡します。
- 音声に関するプロンプトを Gemini モデルに指示します。
Gemini は、次の音声形式の MIME タイプをサポートしています。
- WAV - 音声/WAV
- MP3 - 音声/mp3
- AIFF - 音声/aiff
- AAC - 音声/AAC
- OGG Vorbis - 音声/ogg
- FLAC - 音声/flac
音声に関する技術的な詳細
Gemini では、音声に対して次のルールが適用されます。
- Gemini は、音声 1 秒を 25 個のトークンで表します。たとえば
1 分間の音声は 1,500 トークンで表されます。
- Gemini は英語の音声の回答のみを推測できます。
- Gemini は「理解」できる鳥の鳴き声やサイレンなどの音声以外の要素が含まれます。
- 1 つのプロンプトでサポートされる音声データの最大長は 9.5 時間です。
Gemini では、1 つのプロンプトに含まれる音声ファイルの数に制限はありません。ただし、
1 つのプロンプトに含まれるすべての音声ファイルの合計長は、超えないようにする必要があります
9.5 時間。
- Gemini は、音声ファイルを 16 Kbps のデータ解像度にダウンサンプリングします。
- 音源に複数のチャンネルが含まれている場合、Gemini はそれらのチャンネルを結合します
1 つのチャネルにまで分割できます
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-09-03 UTC。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"必要な情報がない"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"複雑すぎる / 手順が多すぎる"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"最新ではない"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻訳に関する問題"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"サンプル / コードに問題がある"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"その他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"わかりやすい"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"問題の解決に役立った"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"その他"
}]
{"lastModified": "\u6700\u7d42\u66f4\u65b0\u65e5 2024-09-03 UTC\u3002"}
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2024-09-03 UTC。"],[],[]]