공유

2025년 12월 17일

Gemini 3 Flash로 실시간 딥페이크 인텔리전스 제공

Sarah Dolen

AI Futures Fund

조하이브 아흐메드

Resemble AI 설립자 겸 CEO

Vishal Dharmadhikari

개발자 솔루션 엔지니어

Shopify 쇼케이스 히어로

Resemble AI는 생성형 음성 및 딥페이크 탐지 분야의 선두 기업입니다. 딥페이크가 더욱 정교해짐에 따라 규제 산업의 엔터프라이즈 고객은 이진 '실제' 또는 '가짜' 라벨 이상의 정보가 필요합니다. 콘텐츠에 플래그가 지정된 이유를 즉시 이해해야 합니다.

기술적 포렌식과 인간의 이해 사이의 격차를 해소하기 위해 Resemble AI는 복잡한 감지 데이터를 실시간 성능을 저하시키지 않고 자연어 설명으로 변환하는 시스템인 'Resemble Intelligence'에 Gemini 3.0 Flash를 통합했습니다.

속도가 중요합니다. 픽셀 수준 분석부터 고급 추론까지

바이럴 동영상을 확인하려는 소비자든, 발신자를 인증하는 은행의 음성 에이전트든, 사기성 콘텐츠와의 경쟁은 몇 초 만에 이루어집니다. 지연 시간은 중요한 상호작용의 흐름을 방해할 수 있습니다. 기존의 감지 모델은 정확하지만 사용자의 가장 시급한 질문인 '왜 의심스러운가요?'에 답하지 못하는 기술적 히트맵이나 확률 점수를 출력합니다.

Resemble AI는 거의 실시간으로 이 필수 설명 가능성 레이어를 제공하기 위해 Gemini 3.0 Flash와 자체 DETECT-3B Omni 모델을 페어링하여 특정 조작 아티팩트를 식별하고 풍부한 맥락의 설명을 생성하는 원활한 파이프라인을 구축했습니다. 이 통합은 2.5 Pro보다 4배 빠른 멀티모달 분석을 지원하며, 중요한 워크플로를 늦추지 않고 원시 기술 출력을 분석합니다.

단축된 장면

또한 Resemble AI는 Gemini 3 Flash를 최신 오픈소스 텍스트 음성 변환 모델인 Chatterbox와 페어링하여 1초 미만의 응답 시간을 갖는 대화형 음성 AI 에이전트를 제공합니다.

그라운딩된 인텔리전스: 포렌식 무결성 우선순위 지정

Resemble AI는 Gemini 3.0 Flash의 고급 추론을 활용하여 더 높은 수준의 법의학적 무결성을 달성합니다. 이 시스템은 이전 반복보다 조작된 아티팩트를 25% 적게 생성하므로 모든 자동 설명이 포렌식 데이터를 기반으로 합니다.

이 정확도는 규제 요건을 준수해야 하는 비즈니스에 매우 중요합니다. 엔터프라이즈가 EU AI법과 같은 글로벌 투명성 의무를 준수할 수 있도록 Resemble AI는 Gemini 3 Flash를 사용하여 독점 워터마크를 확인하고 명확하고 실행 가능한 인텔리전스를 제공합니다.

인증된 음성 에이전트의 경우 실시간으로 감지가 이루어집니다. 통화에 플래그가 지정되면 Gemini 3 Flash가 관련된 특정 위험 요소를 설명하는 요약을 즉시 생성합니다. 이를 통해 원활한 '인간 핸드오프'가 가능해져 상담사가 맹목적으로 인계받는 것이 아니라 전체 맥락을 파악한 상태로 인계받을 수 있습니다.

Resemble AI의 구현은 안전과 속도가 상충되지 않음을 보여줍니다. 감지 보고서에 설명 가능성 레이어를 추가하여 딥페이크를 감지할 뿐만 아니라 딥페이크에 대응하는 데 필요한 인텔리전스를 기업에 제공합니다.

Gemini 모델로 빌드를 시작하려면 API 문서를 읽거나 Google AI Studio에서 모델을 사용해 보세요.