Tâches d'IA entraînées sans avoir besoin de grands ensembles de données dédiés.
Description
Cette API peut détecter les deepfakes, convertir la parole en texte, analyser la langue des signes américaine, etc., sans avoir à être entraînée sur un ensemble de données. Cela est possible grâce à Gemini Flash 1.5 et à sa technique "Imposition-Context". Cette API inclut actuellement des tâches d'IA telles que la détection de deepfake, la conversion de la parole en texte multilingue avec des résultats supérieurs à whisper-large-v3 sur l'audio multilingue, l'analyse et l'interprétation détaillées et précises de la langue des signes dans les vidéos, la classification de jusqu'à 80 états émotionnels du texte en seulement deux secondes, et la reconnaissance optique des caractères avec une détection et une précision des caractères comparables aux grands systèmes de reconnaissance optique des caractères existants. Je travaille toujours à l'intégration de nouvelles tâches d'IA. Si nous envoyons simplement la vidéo à Gemini Flash 1.5, il ne pourra pas détecter le deepfake. Comme vous pouvez le constater, Gemini Flash 1.5 a du mal à identifier le deepfake. C'est pourquoi j'ai développé la technique d'invite "Imposing-context". Au lieu de l'approche traditionnelle, où l'utilisateur invite le modèle et attend qu'il interprète le contexte lui-même, "Imposing-context" dicte directement l'historique de sortie du modèle. Le modèle lui-même n'écrit pas les réponses, c'est moi qui le fais. Mais lorsqu'il examine l'historique de chat, il pense à tort qu'il a généré ces réponses. Cela l'oblige à comprendre l'intention de l'utilisateur. Comme vous pouvez le constater, cette approche donne des résultats étonnants. Gemini Flash 1.5 est capable d'analyser les deepfakes, mais aussi d'atteindre une précision incroyable.
Conçu avec
API AI
Équipe
Par
ShynAI
De
Viêt Nam
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],[],[],[],null,["# EverythingAI API\n\n[More Apps](/competition/vote) \n\nEverythingAI API\n================\n\nAI tasks trained without the need for dedicated large datasets. \nVote \nVoted!\nWhat it does\n\nThis API can detect deepfakes, convert speech to text, analysis of ASL sign language, etc. without needing to be trained on any dataset. This is possible thanks to Gemini Flash 1.5 and their \"Imposition-Context\" technique. \nThis API currently includes AI tasks such as: deepfake detection, multilingual speech-to-text conversion with results exceeding whisper-large-v3 on multilingual audio, detailed and accurate analysis and interpretation of sign language in videos, classification of up to 80 emotional states of text in just 2 seconds, and OCR with character detection and accuracy comparable to existing large OCR systems. And I am still working on integrating more AI tasks. \nIf we simply feed the video to Gemini Flash 1.5 on its own, it won't be able to detect the deepfake. You can see here, Gemini Flash 1.5 is struggling to identify the deepfake. This is why I developed the \"Imposing-context\" prompting technique. \nInstead of the traditional approach where the user prompts the model and waits for it to interpret the context on its own, \"Imposing-context\" directly dictates the model's output history. The model itself doesn't actually write the responses, those are written by me. \nBut when it looks at the chat history, it mistakenly believes it generated those answers. This forces it to understand the user's intent. As you can see, this approach gives amazing results. Gemini Flash 1.5 is not only able to analyze deepfakes but also achieves incredible accuracy. \nBuilt with\n\n- API AI \nTeam \nBy\n\nShynAI \nFrom\n\nVietnam \n[](/competition/vote)"]]