WalkieTalk-KI

Mit wem sprechen Sie?

Funktion

Die Anwendung funktioniert wie ein Walkie-Talkie, da Nutzer über verschiedene „Frequenzen“ eine Verbindung herstellen und mit verschiedenen KI-Charakteren auf der ganzen Welt sprechen können.

Die Charaktere basieren auf der Gemini API und sollen interessante und nachdenkliche Unterhaltungen anregen. Sie sind vielfältig und reichen von einer Biologin, die den Amazonas-Regenwald erkundet, bis hin zu einem Astronauten, der sich derzeit auf der Internationalen Raumstation befindet.

Die Anwendung nutzt die Gemini API, um anhand der Nutzereingaben und der Persona der Charaktere geeignete Antworten zu generieren. Die Text-zu-Sprach- und Sprach-zu-Text-Dienste von Google werden verwendet, um Unterhaltungsdaten zu diesen Eingaben und Antworten zu generieren. Google Cloud Storage wird für den temporären Dateispeicher verwendet.

Jede Antwort in einer Unterhaltung wird transkribiert, gespeichert und in jeden Gemini API-Aufruf eingefügt, um Kontext zu dieser Unterhaltung bereitzustellen. Zuerst werden verschiedene Prompts verwendet, um die einzelnen Charaktere durch ihren Namen und ihre Hintergrundgeschichte eindeutig voneinander zu unterscheiden.

Basis

  • Flutter
  • Android
  • Web/Chrome
  • Google Cloud Storage
  • Google Sprachausgabe
  • Google Sprachausgabe
  • Google Compute Engine

Team

Von

Ryan Smith

Von

UK