Google đang nhúng thuỷ vân không thể nghe được vào trong âm nhạc do AI của mình tạo ra

Bản tin được tóm tắt Anh-Việt bởi nền tảng tạo trợ lý AI – KamiMind.
Nguồn: Jon Porter, “Google is embedding inaudible watermarks right into its AI generated music“, The Verge, 16/11/2023.

Google sẽ sử dụng SynthID để đánh dấu âm thanh từ mô hình Lyria của DeepMind, giúp xác định xem công nghệ AI của Google có được sử dụng trong việc tạo ra một bản nhạc hay không. Âm thanh được tạo ra bằng mô hình AI Lyria của Google DeepMind, như các bản nhạc được tạo ra với các tính năng tạo âm thanh mới của YouTube, sẽ được đánh dấu bằng SynthID để cho phép người dùng nhận biết nguồn gốc do AI tạo ra. DeepMind cho biết rằng dấu ấn (watermark) không nên được phát hiện bởi tai người và “không làm ảnh hưởng đến trải nghiệm nghe,” và thêm rằng nó vẫn nên được phát hiện ngay cả khi một đoạn âm thanh được nén, tăng tốc hoặc chậm lại, hoặc có thêm tiếng ồn.

Các công cụ đánh dấu như SynthID được coi là một biện pháp bảo vệ quan trọng đối với một số thiệt hại của AI sinh học. Lệnh hành pháp của Tổng thống Joe Biden về trí tuệ nhân tạo, ví dụ, kêu gọi một bộ tiêu chuẩn mới do chính phủ dẫn dắt cho việc đánh dấu nội dung được tạo ra bởi AI. Đây là một lĩnh vực đầy hứa hẹn, vì các công nghệ hiện tại vẫn chưa là một giải pháp hoàn hảo để phòng chống giả mạo.

Theo DeepMind, việc triển khai âm thanh của SynthID hoạt động bằng cách “chuyển đổi sóng âm thanh thành một hình ảnh hai chiều cho thấy cách thức phổ tần số trong một âm thanh thay đổi theo thời gian.” Họ khẳng định rằng phương pháp này “khác biệt với bất cứ thứ gì tồn tại ngày nay.”

Tin tức về việc Google nhúng tính năng đánh dấu vào âm thanh do AI chỉ vài tháng sau khi công ty phát hành SynthID trong bản beta cho hình ảnh được tạo ra bởi Imagen trên Vertex AI của Google Cloud. Mặc dù, dấu ấn chống lại việc chỉnh sửa như cắt xén hoặc thay đổi kích thước, DeepMind cảnh báo rằng nó không chống lại được “những thao tác chỉnh sửa hình ảnh cực đoan”.

Bản tóm tắt tiếng Anh

Google will use SynthID to watermark audio made with its DeepMind’s Lyria model, allowing people to determine if Google’s AI technology was used in the creation of a music track. This watermark should not be discernible by the human ear and should remain detectable even if the audio track is altered in speed, compression, or with added noise.

This move is seen as a crucial safeguard against potential misuse of generative AI. President Joe Biden’s executive order on AI calls for new government-led standards for watermarking AI-generated content. However, current technologies are not yet fully effective against all types of fakes.

DeepMind explains that SynthID works by transforming the audio wave into a two-dimensional visualization that shows the frequency spectrum’s evolution over time, a method claimed to be unique.

This news follows Google’s release of SynthID in beta for images made by Imagen on Google Cloud’s Vertex AI. The watermark is resistant to some editing techniques such as cropping or resizing but not against extreme image manipulations.