Google DeepMind 開源數位浮水印工具，SynthID text 如何運作？

生成式 AI 能夠產生多樣化內容，規模遠遠超乎人們想像。儘管運用生成式 AI 的行為大多是為合法目的，但人們擔心生成式 AI 遭到濫用，衍生種種問題。數位浮水印是減輕這些潛在風險的一種技術，可在 AI 生成內容套用肉眼無法察覺的浮水印。

Google 透過新推出的 Responsible Generative AI Toolkit，正式開源 SynthID text 數位浮水印工具，這項技術可對 AI 生成的文字添加浮水印並進行檢測。

為此，Google 在科學期刊《自然》發表一篇論文，詳細說明 SynthID text 的技術原理。Gogole 也與 Hugging Face 合作，為此平台提供 SynthID text，使開發者能夠運用這項技術開發模型。

Today, we’re open-sourcing our SynthID text watermarking tool through an updated Responsible Generative AI Toolkit.

Available freely to developers and businesses, it will help them identify their AI-generated content. 🔍

Find out more → https://t.co/n2aYoeJXqn pic.twitter.com/4uRKYaz57Y

— Google DeepMind (@GoogleDeepMind) October 23, 2024

▲ Google DeepMind 宣布開源 SynthID text 數位浮水印工具。

開發 SynthID text 的 Google DeepMind 舉例，例如輸入「What’s your favorite fruit?」這樣的提示，大型語言模型會產生文字序列。模型會預測哪個詞元（token）最有可能跟隨另一個詞元，每個可能的詞元會被分配一個分數，即是正確詞元的百分比機會，分數越高的詞元代表越有可能被用到。

SynthID Text 透過調整生成詞元的可能性，在詞元分配中插入附加資訊達到目的。Google DeepMind 強調，這麼做不會影響 AI 生成文字的品質、準確性、創造力及生成速度。

「模型的詞彙選擇與調整後的機率分數結合成最終分數，被視為浮水印」，Google DeepMind 表示，「這種分數模式與有浮水印和無浮水印文字的預期分數模式進行比較，有助於 SynthID 檢測文字是否由 AI 工具生成，或者可能來自其他來源。」

不過，Google DeepMind 承認數位浮水印仍有限制，例如 SynthID text 在處理簡短文字、重寫或從其他語言翻譯而來的文字、及對事實問題的回答可能效果不佳。

根據歐盟執法機構的報告顯示，到了 2026 年，90% 線上內容可能是綜合生成，恐怕夾雜有越來越多不實資訊、詐騙等狀況，對執法機構帶來挑戰，這也是為何科技公司投入研究、提出如 SynthID 這種數位浮水印技術的原因之一，希望幫助人們判別 AI 生成內容，進一步對抗不實資訊散布。

（首圖來源：Google DeepMind Blog）