Gemini Voice Companion

Menggunakan Gemini dengan cara yang didorong suara untuk asisten pribadi

Fungsinya

Ini adalah asisten suara yang didukung oleh AI Gemini, yang menampilkan kemampuan text-to-speech dan speech-to-text lokal yang menjembatani interaksi suara dan teks. API Gemini unggul dalam memahami konteks dan mengirim perintah untuk berbagai skenario. Dengan membuat konteks dan memanfaatkan integrasi API, Gemini dapat menjalankan skrip Python untuk menjalankan berbagai fungsi.
Dalam aplikasi ini, pengguna dapat berinteraksi dengan asisten sepenuhnya melalui suara, sehingga memungkinkan operasi handsfree dan tanpa melihat layar. Hal ini membuatnya sangat berguna dalam situasi saat suara adalah satu-satunya sarana komunikasi yang tersedia. Kemampuan asisten ini mencakup:

Pengenalan beberapa pembicara
Pemfilteran derau suara yang tidak dikenal
Mengontrol perangkat smart home
Meniru suara pengguna
Beralih antarsuara dan kepribadian yang berbeda
Membaca dan meringkas artikel berita
Mendapatkan informasi cuaca dan informasi lainnya
Memutar musik Spotify
Mengambil foto dan menganalisisnya
Membuka link melalui Chrome
Menjadwalkan pengingat suara atau tindakan umum

Keterampilan asisten yang didukung Gemini dan desain yang berfokus pada suara menjadikannya alat yang canggih untuk berbagai aplikasi handsfree dan eyes-free, termasuk hiburan di dalam mobil, panduan jalan kaki, pengelolaan rumah, dll.

Dibuat dengan

  • Web/Chrome

Tim

Oleh

Zhenya Yang

From

Australia