當前學生利用 ChatGPT 撰寫作業的情形非常泛濫,雖然過去 OpenAI 曾推出 AI 文字偵測器 AI Classifier 來協助檢測學生所繳作業是否是 ChatGPT 代勞的,但卻因為「準確率低」而在去年 7 月下旬關閉。如今,OpenAI 改弦更張開發出採用不同偵測方法的文字浮水印(text watermarking),但有鑑於該技術涉及的複雜性,以及可能對 OpenAI 以外更廣泛生態系統造成影響,所以該公司正在慎重考慮是否要推出該工具。
OpenAI 發言人指出,儘管該公司開發的文字浮水印技術潛力十足,但在研究替代方案時則會考慮其可能的重大風險,包括被惡意份子規避的可能性,以及可能會對非英語系使用者造成不成比例的影響。
透過文字浮水印技術,OpenAI 將專注於偵測 ChatGPT 所生成的文字,而不會偵測其他家模型的生成結果。其原理是對 ChatGPT 選擇詞語的方式進行微小的改變,進而在文字中建立一個無形的浮水印,之後再透過獨立的工具來進行偵測。
隨著《華爾街日報》在週日(4 日)發表揭露該工具的報導後,OpenAI 隨即在當天將原先在 5 月發表的一份官方部落客文章進行了更新,主要更新內容在探討關於其偵測 AI 生成內容的研究。文中提到只要是改寫等「局部性文字篡改」,該文字浮水印技術的偵測「高度準確」。但若使用翻譯系統,或透過另外的生成模型重新改寫,甚至要生成式模型在每個單詞之間插入一個特殊字元,然後再加以刪除的「全面性文字篡改」,該技術的偵測表現就不太可靠了。
也因為如此,OpenAI 認為該技術有可能很容易地被惡意份子規避。由於 AI 生成對非英語使用者在學習、研究上很有幫助,但該技術有可能偏頗地將他們視 AI 為有用寫作工具的做法污名化,進而造成他們日常學習與工作上的困擾。不過該技術仍在開發中,相信該公司會針對這些問題進行改善。
(首圖來源:科技新報)