Gemini Voice Companion
Menggunakan Gemini dengan cara yang didorong suara untuk asisten pribadi
Fungsinya
Ini adalah asisten suara yang didukung oleh AI Gemini, yang menampilkan kemampuan text-to-speech dan speech-to-text lokal yang menjembatani interaksi suara dan teks. API Gemini unggul dalam memahami konteks dan mengirim perintah untuk berbagai skenario. Dengan membuat konteks dan memanfaatkan integrasi API, Gemini dapat menjalankan skrip Python untuk menjalankan berbagai fungsi.
Dalam aplikasi ini, pengguna dapat berinteraksi dengan asisten sepenuhnya melalui suara, sehingga memungkinkan operasi handsfree dan tanpa melihat layar. Hal ini membuatnya sangat berguna dalam situasi saat suara adalah satu-satunya sarana komunikasi yang tersedia. Kemampuan asisten ini mencakup:
Pengenalan beberapa pembicara
Pemfilteran derau suara yang tidak dikenal
Mengontrol perangkat smart home
Meniru suara pengguna
Beralih antarsuara dan kepribadian yang berbeda
Membaca dan meringkas artikel berita
Mendapatkan informasi cuaca dan informasi lainnya
Memutar musik Spotify
Mengambil foto dan menganalisisnya
Membuka link melalui Chrome
Menjadwalkan pengingat suara atau tindakan umum
Keterampilan asisten yang didukung Gemini dan desain yang berfokus pada suara menjadikannya alat yang canggih untuk berbagai aplikasi handsfree dan eyes-free, termasuk hiburan di dalam mobil, panduan jalan kaki, pengelolaan rumah, dll.
Dibuat dengan
- Web/Chrome
Tim
Oleh
Zhenya Yang
From
Australia