Gemini API ile ses özelliklerini keşfedin

Gemini, sesle ilgili istemlere yanıt verebilir. Örneğin, Gemini:

  • Ses içeriğiyle ilgili soruları tanımlayın, özetleyin veya yanıtlayın.
  • Sesin transkriptini sağlayın.
  • Sesin belirli bir segmentiyle ilgili yanıtlar veya transkript sağlayın.

Bu kılavuzda, Gemini API'yi kullanarak ses dosyalarıyla ve ses içerikleriyle etkileşime geçmenin farklı yolları gösterilmektedir.

Desteklenen ses biçimleri

Gemini, aşağıdaki ses biçimi MIME türlerini destekler:

  • WAV - audio/wav
  • MP3 - audio/mp3
  • AIFF - audio/aiff
  • AAC - audio/aac
  • OGG Vorbis - audio/ogg
  • FLAC - audio/flac

Sesle ilgili teknik ayrıntılar

Gemini, ses için aşağıdaki kuralları uygular:

  • Gemini, sesin her saniyesini 25 jeton olarak temsil eder. Örneğin,bir dakikalık ses 1.500 jeton olarak temsil edilir.
  • Gemini yalnızca İngilizce konuşmalara yanıt verebilir.
  • Gemini, kuş sesi veya siren sesi gibi konuşma dışı bileşenleri "anlayabilir".
  • Tek bir istemde desteklenen maksimum ses verisi uzunluğu 9,5 saattir. Gemini, tek bir istemdeki ses dosyalarının sayısını sınırlamaz.Ancak tek bir istemdeki tüm ses dosyalarının toplam uzunluğu 9,5 saati aşamaz.
  • Gemini, ses dosyalarını 16 Kb/sn. veri çözünürlüğüne indirger.
  • Ses kaynağı birden fazla kanal içeriyorsa Gemini bu kanalları tek bir kanalda birleştirir.

Sırada ne var?

Bu kılavuzda, File API'yi kullanarak ses dosyalarının nasıl yükleneceği ve ardından ses girişlerinden metin çıkışlarının nasıl oluşturulacağı gösterilmektedir. Daha fazla bilgi için aşağıdaki kaynaklara göz atın:

  • Dosya istemi stratejileri: Gemini API, metin, resim, ses ve video verileriyle istemi destekler. Bu, çoklu formatlı istem olarak da bilinir.
  • Sistem talimatları: Sistem talimatları, modelin davranışını belirli ihtiyaçlarınıza ve kullanım alanlarınıza göre yönlendirmenize olanak tanır.
  • Güvenlik kılavuzu: Üretken yapay zeka modelleri bazen yanlış, önyargılı veya rahatsız edici gibi beklenmedik çıkışlar üretebilir. Bu tür çıkışlardan kaynaklanan zarar riskini sınırlamak için işlem sonrası ve gerçek kişiler tarafından değerlendirme yapılması önemlidir.