EverythingAI API
訓練 AI 工作時,不需要專屬的大型資料集。
用途
這個 API 可偵測深偽造內容、將語音轉換為文字、分析美國手語等,無須使用任何資料集進行訓練。這要歸功於 Gemini Flash 1.5 和「Imposition-Context」技術。
這個 API 目前支援多項 AI 作業,例如:深偽造偵測、多語言語音轉文字 (結果優於多語音訊的 whisper-large-v3)、詳細且準確的影片手語分析與解讀、在 2 秒內分類最多 80 種情緒狀態的文字,以及可與現有大型 OCR 系統相提並論的光學字元辨識 (OCR) 字元偵測功能。我仍在整合更多 AI 工作。
如果我們只將影片提供給 Gemini Flash 1.5,系統就無法偵測深偽造內容。如您所見,Gemini Flash 1.5 無法識別深偽造內容。因此,我開發了「Imposing-context」提示技術。
與傳統方法不同,使用者不必提示模型,等待模型自行解讀情境,而是直接指定模型的輸出記錄。模型本身並不會寫回覆,而是由我寫的。
但當模型查看即時通訊記錄時,會誤以為自己產生了這些答案。這會強制系統瞭解使用者的意圖。如您所見,這種方法可帶來驚人的成果。Gemini Flash 1.5 不僅能分析深偽造影像,準確度也相當高。
採用
- API AI
團隊
變更者
ShynAI
寄件者
越南