Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

SecondEye

Ihr interaktiver und trainierbarer visueller Assistent

Funktion

SecondEye ist ein interaktiver und trainierbarer visueller Assistent. Sie kann für eine Vielzahl von visionären Aufgaben und Anwendungsfällen verwendet werden. Außerdem kann es ohne Training oder Programmierung zu personalisierten Aufgaben im Bereich Computer Vision eingesetzt werden. Und das alles auf interaktive und iterative Weise.
SecondEye kann derzeit nur mit Gemini erstellt werden, da dieses Modell folgende einzigartige Funktionen bietet:
1. Objekterkennung mit der Möglichkeit, genaue Begrenzungsrahmenpositionen zurückzugeben
2. Unterstützung für native Videos mit der Möglichkeit, getimte Informationen zurückzugeben
3. Großes Kontextfenster
SecondEye nutzt diese Funktionen, um diese einzigartigen und völlig neuen KI-Funktionen anzubieten:
• Für Bilder (Funktion 1):
◦ Annotierte Objektdefinitionen
◦ Fragen zu einem bestimmten Teil eines Bildes stellen
◦ Verbesserung:
▪ Objektsuche
▪ Fragen zur Reparatur oder Montage
▪ Anfragen für visuelles Feedback
◦ Dem Modell einen annotierten Teil eines Bildes beibringen
• Für Video (Funktion 2):
◦ Verbesserte Videosuche
• Für Live-Kameravideo (Funktion 3):
◦ Personalisierte Echtzeit-Videoanalyse
◦ Dem Modell etwas mit einem Video beibringen
◦ Visuelle Echtzeithilfe für Menschen mit Sehbehinderung, mit der Möglichkeit, Gesichter, Objekte und Orte für die zukünftige Erkennung zu speichern.
• Für die Live-Bildschirmfreigabe (Funktion 3):
◦ Dem Modell einen Workflow beibringen
◦ IT- oder Programmiersupport
◦ Websurfen und die allgemeine Computernutzung für Menschen mit Sehbehinderung verbessern

Basis

Web/Chrome
Firebase
Firebase Genkit
Google Sprachausgabe/Text-to-Speech

Team

Von

Zakaria KADDARI

Von

Marokko