Pindrop tuyên bố có thể phát hiện giọng nói AI giả mạo với độ chính xác 99%

Pindrop tuyên bố có thể phát hiện giọng nói AI giả mạo với độ chính xác 99%

Hôm nay, Pindrop, công ty cung cấp các giải pháp bảo mật giọng nói, xác minh danh tính và phát hiện gian lận, đã công bố phát hành Pulse Inspect, một công cụ dựa trên web để phát hiện giọng nói do AI tạo ra trong bất kỳ tệp âm thanh hoặc video kỹ thuật số nào với độ chính xác cao đáng kể: 99%.

Tính năng này hiện đang được cung cấp bản xem trước như một phần của bộ sản phẩm Pulse của Pindrop và cung cấp khả năng phát hiện bất kể công cụ hoặc mô hình AI được sử dụng để tạo ra âm thanh.

Đây là một nỗ lực đáng chú ý và đầy tham vọng so với thông lệ chung của ngành, nơi các nhà cung cấp AI phát hành các bộ phân loại AI chỉ để phát hiện nội dung tổng hợp được tạo từ công cụ của họ.

Pindrop đang cung cấp Pulse Inspect theo hình thức đăng ký hàng năm cho các tổ chức đang tìm cách chống lại nguy cơ giả mạo âm thanh trên diện rộng. Tuy nhiên, Giám đốc điều hành Vijay Balasubramaniyan nói với VentureBeat rằng họ có thể tung ra các mức giá phải chăng hơn – với số lượng kiểm tra phương tiện truyền thông hạn chế – cho người tiêu dùng.

“Chính sách giá của chúng tôi được thiết kế cho các tổ chức có nhu cầu thường xuyên về phát hiện giả mạo. Tuy nhiên, dựa trên nhu cầu thị trường trong tương lai, chúng tôi có thể xem xét tung ra các tùy chọn giá phù hợp hơn cho người dùng thông thường trong tương lai”, ông nói.

Pindrop giải quyết sự gia tăng của hiện tượng giả mạo âm thanh

Mặc dù giả mạo sâu (deepfakes) đã xuất hiện từ lâu, nhưng sự gia tăng của các hệ thống AI tạo văn bản đã khiến chúng trở nên phổ biến hơn trên internet. Các công cụ AI phổ biến, như của Microsoft và ElevenLabs, đã bị lợi dụng để bắt chước âm thanh và video của những người nổi tiếng, doanh nhân và chính trị gia nhằm lan truyền thông tin sai lệch/lừa đảo trên diện rộng – ảnh hưởng đến hình ảnh của họ trước công chúng.

Theo báo cáo nội bộ của Pindrop, hơn 12 triệu người trưởng thành ở Mỹ biết ai đó đã bị tạo ra giả mạo sâu mà không có sự đồng ý của họ. Những bản sao này có thể là bất cứ thứ gì từ hình ảnh, video đến âm thanh, nhưng tất cả đều có một điểm chung: chúng phát triển mạnh mẽ, lan truyền như cháy rừng trên mạng xã hội.

Để giải quyết vấn đề đang diễn ra này, Pindrop đã công bố bộ sản phẩm Pulse vào đầu năm nay. Sản phẩm đầu tiên trong danh mục đầu tư đã giúp các doanh nghiệp phát hiện các cuộc gọi giả mạo đến trung tâm cuộc gọi của họ. Giờ đây, với Pulse Inspect, công ty đang vượt ra ngoài các cuộc gọi để giúp các tổ chức kiểm tra bất kỳ tệp âm thanh/video nào về các tạo phẩm tổng hợp do AI tạo ra.

Tải lên các tệp âm thanh đáng ngờ để phân tích

Về cốt lõi, dịch vụ này được cung cấp dưới dạng ứng dụng web, nơi người dùng doanh nghiệp có thể tải lên tệp nghi ngờ để phân tích.

Trước đây, toàn bộ quá trình kiểm tra các tạo phẩm tổng hợp trong các tệp phương tiện hiện có đòi hỏi phải kiểm tra kỹ thuật số mất thời gian. Tuy nhiên, trong trường hợp này, công cụ xử lý âm thanh chỉ trong vài giây và đưa ra “điểm giả mạo sâu”, hoàn chỉnh với các phần chứa giọng nói do AI tạo ra.

Phản hồi nhanh chóng này sau đó có thể cho phép các tổ chức chủ động thực hiện các hành động để ngăn chặn việc lan truyền thông tin sai lệch và duy trì uy tín thương hiệu của họ.

Quá trình đào tạo và phân tích

Pindrop cho biết họ đã đào tạo một mô hình phát hiện giả mạo sâu độc quyền trên hơn 350 công cụ tạo giả mạo sâu, 20 triệu câu nói độc đáo và hơn 40 ngôn ngữ, dẫn đến tỷ lệ phát hiện âm thanh giả mạo ở mức 99% dựa trên phân tích nội bộ của công ty về tập dữ liệu khoảng 200 nghìn mẫu.

Mô hình kiểm tra các tệp phương tiện về các tạo phẩm tổng hợp cứ sau bốn giây, đảm bảo phân loại giả mạo sâu một cách chính xác, đặc biệt là trong trường hợp phương tiện truyền thông hỗn hợp có chứa cả yếu tố do AI tạo ra và yếu tố chính hãng.

“Công nghệ của Pindrop tận dụng những đột phá gần đây trong mạng nơ-ron sâu (DNN) và phân tích phổ-thời gian tinh vi để xác định các tạo phẩm tổng hợp bằng nhiều phương pháp tiếp cận”, Balasubramaniyan giải thích.

Không giới hạn phát hiện theo nhà cung cấp cụ thể

Vì Pindrop đã đào tạo mô hình phát hiện của mình trên hơn vài trăm công cụ tạo ra, Pulse Inspect không có giới hạn cụ thể nào của công cụ để phát hiện.

“Có hơn 350 hệ thống tạo giả mạo sâu, với nhiều giả mạo sâu âm thanh phổ biến trên mạng xã hội có khả năng đến từ các công cụ nguồn mở hơn là các công cụ thương mại như ElevenLabs. Khách hàng cần các công cụ toàn diện như của Pindrop, không giới hạn trong việc phát hiện giả mạo sâu từ một hệ thống duy nhất mà có thể xác định âm thanh tổng hợp trên tất cả các hệ thống tạo ra”, Balasubramaniyan cho biết thêm.

Tuy nhiên, điều quan trọng cần lưu ý là có thể có những trường hợp công cụ có thể không xác định được giả mạo sâu, đặc biệt là khi tệp có thời lượng lời thoại ròng dưới hai giây hoặc có mức độ tiếng ồn xung quanh rất cao. Giám đốc điều hành cho biết công ty đang liên tục nỗ lực để giải quyết những lỗ hổng này và tiếp tục cải thiện độ chính xác của phát hiện.

Hiện tại, Pindrop đang nhắm mục tiêu Pulse Inspect vào các tổ chức như công ty truyền thông, tổ chức phi lợi nhuận, cơ quan chính phủ, công ty quản lý người nổi tiếng, công ty luật và mạng xã hội. Balasubramaniyan không chia sẻ con số chính xác khách hàng sử dụng công cụ này nhưng ông cho biết “một số đối tác” đang sử dụng sản phẩm bằng cách trả tiền cho đăng ký hàng năm dựa trên khối lượng. Điều này bao gồm TrueMedia.org, một sản phẩm sử dụng miễn phí cho phép khán giả bầu cử quan trọng phát hiện giả mạo sâu.

Ngoài ứng dụng web hỗ trợ tải lên thủ công, Pulse Inspect cũng có thể được tích hợp vào quy trình làm việc kỹ thuật số tùy chỉnh thông qua API. Điều này có thể cung cấp năng lượng cho các trường hợp sử dụng hàng loạt chẳng hạn như mạng xã hội gắn cờ và xóa video do AI tạo ra có hại.

Tiếp tục, Balasubramaniyan cho biết, công ty có kế hoạch củng cố bộ sản phẩm Pulse bằng cách cải thiện khía cạnh khả năng giải thích của các công cụ – với tính năng truy ngược lại nguồn gốc tạo ra giả mạo sâu – và hỗ trợ nhiều phương thức hơn.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *