Gemini Voice Companion

ใช้ Gemini ในลักษณะที่ทำงานด้วยเสียงสำหรับผู้ช่วยส่วนตัว

การทำงาน

นี่คือผู้ช่วยเสียงที่ทำงานด้วยระบบ AI ของ Gemini ซึ่งมาพร้อมความสามารถในการอ่านออกเสียงข้อความและแปลงคำพูดเป็นข้อความในเครื่องที่เชื่อมการโต้ตอบด้วยเสียงและข้อความเข้าด้วยกัน API ของ Gemini เข้าใจบริบทและส่งคำสั่งสำหรับสถานการณ์ต่างๆ ได้เป็นอย่างดี การสร้างบริบทและการใช้การผสานรวม API ช่วยให้ Gemini สามารถเรียกใช้สคริปต์ Python เพื่อทำงานต่างๆ ได้
ในแอปพลิเคชันนี้ ผู้ใช้สามารถโต้ตอบกับผู้ช่วยได้ทั้งหมดผ่านเสียง ซึ่งช่วยให้ทำงานได้โดยไม่ต้องใช้มือและไม่ต้องเพ่งมอง ซึ่งจะเป็นประโยชน์อย่างยิ่งในสถานการณ์ที่เสียงเป็นวิธีสื่อสารเพียงวิธีเดียวที่ใช้ได้ ความสามารถของ Assistant ประกอบด้วย

การจดจำผู้พูดหลายคน
การกรองเสียงรบกวนที่ไม่รู้จัก
การควบคุมอุปกรณ์สมาร์ทโฮม
การเลียนแบบเสียงของผู้ใช้
การสลับระหว่างเสียงและบุคลิกที่แตกต่างกัน
การอ่านและสรุปบทความข่าว
ดูข้อมูลสภาพอากาศและข้อมูลอื่นๆ
เล่นเพลง Spotify
ถ่ายภาพและวิเคราะห์
ไปยังส่วนต่างๆ ของลิงก์ผ่าน Chrome
ตั้งเวลาการช่วยเตือนด้วยเสียงหรือการดำเนินการทั่วไป

ความอเนกประสงค์และการออกแบบที่เน้นเสียงของ Assistant ที่ทำงานด้วย Gemini ทำให้เป็นเครื่องมือที่มีประสิทธิภาพสำหรับแอปพลิเคชันต่างๆ มากมายที่ใช้งานโดยไม่ต้องใช้มือและไม่ต้องเพ่งมอง เช่น ความบันเทิงในรถยนต์ คำแนะนำในการเดิน การจัดการบ้าน ฯลฯ

สร้างขึ้นด้วย

  • เว็บ/Chrome

ทีม

โดย

Zhenya Yang

จาก

ออสเตรเลีย