Ngày 17 tháng 12 năm 2025
Cung cấp thông tin tình báo về nội dung giả tạo siêu thật theo thời gian thực bằng Gemini 3 Flash
Resemble AI là công ty hàng đầu về giọng nói tạo sinh và phát hiện nội dung làm giả siêu thật. Khi nội dung giả tạo siêu thật ngày càng tinh vi, các khách hàng doanh nghiệp trong những ngành chịu sự quản lý cần nhiều hơn nhãn "Thật" hoặc "Giả" đơn thuần. Họ cần hiểu ngay lý do nội dung bị gắn cờ.
Để thu hẹp khoảng cách giữa hoạt động pháp y kỹ thuật và sự hiểu biết của con người, Resemble AI đã tích hợp Gemini 3.0 Flash vào "Resemble Intelligence", một hệ thống chuyển đổi dữ liệu phát hiện phức tạp thành nội dung giải thích bằng ngôn ngữ tự nhiên mà không làm giảm hiệu suất theo thời gian thực.
Tốc độ là yếu tố quan trọng nhất: Từ phân tích ở cấp độ pixel đến suy luận ở cấp độ cao
Cho dù đó là người tiêu dùng đang cố gắng xác minh một video lan truyền hay nhân viên hỗ trợ thoại của ngân hàng đang xác thực người gọi, cuộc chiến chống lại nội dung gian lận diễn ra trong vài giây. Độ trễ có thể làm gián đoạn quy trình của các hoạt động tương tác quan trọng. Theo truyền thống, các mô hình phát hiện sẽ xuất ra bản đồ nhiệt kỹ thuật hoặc điểm số xác suất. Mặc dù chính xác, nhưng những mô hình này không trả lời được câu hỏi cấp bách nhất của người dùng: "Tại sao nội dung này lại đáng ngờ?"
Để cung cấp lớp giải thích thiết yếu này gần như theo thời gian thực, Resemble AI đã xây dựng một quy trình liền mạch kết hợp mô hình DETECT-3B Omni độc quyền của họ để xác định các thành phần giả mạo cụ thể bằng Gemini 3.0 Flash nhằm tạo ra nội dung giải thích giàu ngữ cảnh. Việc tích hợp này giúp phân tích đa phương thức nhanh hơn gấp 4 lần so với phiên bản 2.5 Pro, phân tích đầu ra kỹ thuật thô mà không làm chậm các quy trình công việc quan trọng.
Trình tự được rút ngắn
Resemble AI cũng kết hợp Gemini 3 Flash với mô hình chuyển văn bản sang lời nói mã nguồn mở mới nhất của họ là Chatterbox để tạo ra các trợ lý AI bằng giọng nói có tính tương tác với thời gian phản hồi dưới một giây.
Thông tin tình báo có căn cứ: Ưu tiên tính toàn vẹn pháp lý
Resemble AI tận dụng khả năng suy luận nâng cao của Gemini 3.0 Flash để đạt được tiêu chuẩn cao hơn về tính toàn vẹn pháp lý. Hệ thống tạo ra ít hơn 25% các hiện vật giả mạo so với các lần lặp lại trước đó, đảm bảo rằng mọi giải thích tự động đều dựa trên dữ liệu pháp y.
Độ chính xác này là yếu tố quan trọng đối với những doanh nghiệp cần tuân thủ các yêu cầu theo quy định. Để giúp các doanh nghiệp tuân thủ các quy định minh bạch trên toàn cầu như Đạo luật về AI của Liên minh Châu Âu, Resemble AI sử dụng Gemini 3 Flash để giúp xác minh hình mờ độc quyền và cung cấp thông tin tình báo rõ ràng, có thể hành động.
Đối với các nhân viên hỗ trợ bằng giọng nói đã được xác minh, tính năng phát hiện sẽ diễn ra theo thời gian thực. Nếu một cuộc gọi bị gắn cờ, Gemini 3 Flash sẽ ngay lập tức tạo một bản tóm tắt giải thích các yếu tố nguy cơ cụ thể liên quan. Điều này giúp quá trình "chuyển giao cho người dùng" diễn ra suôn sẻ, đảm bảo nhân viên hỗ trợ tiếp quản với đầy đủ thông tin chứ không phải trong tình trạng không biết gì.
Việc triển khai của Resemble AI cho thấy rằng sự an toàn và tốc độ không nhất thiết phải đánh đổi lẫn nhau. Bằng cách thêm một lớp giải thích vào báo cáo phát hiện, họ giúp cung cấp cho các doanh nghiệp thông tin tình báo cần thiết để hành động đối với nội dung giả tạo siêu thật, chứ không chỉ phát hiện nội dung đó.
Để bắt đầu xây dựng bằng các mô hình Gemini, hãy đọc tài liệu về API của chúng tôi hoặc dùng thử mô hình này trong Google AI Studio.