EverythingAI API
専用の大規模なデータセットを必要とせずにトレーニングされる AI タスク。
機能
この API は、データセットでトレーニングを行うことなく、ディープフェイクの検出、音声のテキスト変換、ASL 手話の分析などを行えます。これは、Gemini Flash 1.5 と「Imposition-Context」手法によって可能になります。
現在、この API には、ディープフェイクの検出、多言語音声の文字変換(多言語音声で whisper-large-v3 を超える結果)、動画内の手話の詳細で正確な分析と解釈、テキストの最大 80 の感情状態をわずか 2 秒で分類する AI タスク、既存の大規模な OCR システムに匹敵する文字検出と精度を備えた OCR など、さまざまな AI タスクが含まれています。今後、さらに多くの AI タスクを統合する予定です。
動画を Gemini Flash 1.5 に単独でフィードしても、ディープフェイクを検出することはできません。Gemini Flash 1.5 はディープフェイクを特定するのに苦労しています。そのため、私は「コンテキストの適用」プロンプト手法を考案しました。
「コンテキストの適用」では、ユーザーがモデルにプロンプトを送信し、モデルがコンテキストを独自に解釈するのを待つという従来のアプローチとは異なり、モデルの出力履歴を直接指示します。モデル自体は実際には回答を作成しません。回答は私が作成します。
しかし、チャットの履歴を見ると、モデルは自分が回答を生成したと誤って認識します。これにより、ユーザーの意図を理解するように強制されます。ご覧のとおり、このアプローチは驚くべき結果をもたらします。Gemini Flash 1.5 は、ディープフェイクを分析できるだけでなく、驚異的な精度を実現します。
構成
- API AI
チーム
By
ShynAI
差出人
ベトナム