Anuj Sharma
Sprachassistent, der die Welt sehen kann
Funktion
Ich liebe die Google API (Gemini), weil sie ein zufriedenstellendes Ergebnis liefert. Ich möchte mein kleines Projekt mithilfe der Gemini API erstellen.
Ich habe eine Python-Anwendung oder eine Art Software mit der Vision entwickelt, eine Singularity-KI oder einen Sprachassistenten zu erstellen. Es gibt viele Codes oder Projekte, in denen Sprachassistenten Befehle per Sprachbefehl entgegennehmen und die Antwort per Sprachbefehl zurückgeben. Sie können unsere Suchanfrage jedoch nicht in Form einer Vision sehen. Deshalb habe ich diese Art von Projekt mithilfe der Gemini API (Pro und Vision Pro) erstellt. Jetzt kann mein Sprachassistent auch die Eingabe als Bild abrufen und meine Antwort sowohl in Text als auch in Sprache beantworten.
Basis
- Keine
- Firebase
Team
Von
Kritrim
Von
Indien