別再用 ChatGPT 寫作業了！OpenAI 開發能抓出作弊文的浮水印

當前學生利用 ChatGPT 撰寫作業的情形非常泛濫，雖然過去 OpenAI 曾推出 AI 文字偵測器 AI Classifier 來協助檢測學生所繳作業是否是 ChatGPT 代勞的，但卻因為「準確率低」而在去年 7 月下旬關閉。如今，OpenAI 改弦更張開發出採用不同偵測方法的文字浮水印（text watermarking），但有鑑於該技術涉及的複雜性，以及可能對 OpenAI 以外更廣泛生態系統造成影響，所以該公司正在慎重考慮是否要推出該工具。

OpenAI 發言人指出，儘管該公司開發的文字浮水印技術潛力十足，但在研究替代方案時則會考慮其可能的重大風險，包括被惡意份子規避的可能性，以及可能會對非英語系使用者造成不成比例的影響。

透過文字浮水印技術，OpenAI 將專注於偵測 ChatGPT 所生成的文字，而不會偵測其他家模型的生成結果。其原理是對 ChatGPT 選擇詞語的方式進行微小的改變，進而在文字中建立一個無形的浮水印，之後再透過獨立的工具來進行偵測。

隨著《華爾街日報》在週日（4 日）發表揭露該工具的報導後，OpenAI 隨即在當天將原先在 5 月發表的一份官方部落客文章進行了更新，主要更新內容在探討關於其偵測 AI 生成內容的研究。文中提到只要是改寫等「局部性文字篡改」，該文字浮水印技術的偵測「高度準確」。但若使用翻譯系統，或透過另外的生成模型重新改寫，甚至要生成式模型在每個單詞之間插入一個特殊字元，然後再加以刪除的「全面性文字篡改」，該技術的偵測表現就不太可靠了。

也因為如此，OpenAI 認為該技術有可能很容易地被惡意份子規避。由於 AI 生成對非英語使用者在學習、研究上很有幫助，但該技術有可能偏頗地將他們視 AI 為有用寫作工具的做法污名化，進而造成他們日常學習與工作上的困擾。不過該技術仍在開發中，相信該公司會針對這些問題進行改善。