AI 能把《哈利波特》整本背出來？研究再掀生成式 AI 侵權爭議

在最新研究中，獨立的 AI 安全與資安研究人員發現，當使用特定提示時，部分商業 AI 聊天機器人能夠重現整本《哈利波特》書籍，這項發現再度引發外界對生成式 AI 可能洩漏受智慧財產權保護內容的疑慮。

研究指出，現代大型語言模型（LLM）在訓練過程中使用大量資料集，而這些資料集可能包含未經授權的媒體內容，並可在特定條件下被誘導重現書籍、新聞報導與劇本，進而衍生法律與倫理爭議。

這項實驗由來自史丹佛與耶魯大學的研究人員共同執行，團隊測試多款商業模型後發現，Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro 與 Grok 3 等模型，皆展現出記憶並重現受智慧財產權保護內容的能力，其行為與開放權重模型相近。研究人員指出，這樣的結果並非理所當然，因為多數商業模型已導入安全機制，且其訓練資料來源透明度有限。

研究進一步顯示，在特定提示下，模型可輸出大量受智慧財產權保護的文本內容。例如，研究人員自越獄狀態下的 Claude 3.7 Sonnet 中提取近 95.8% 的《哈利波特與魔法石》內容；而 Gemini 2.5 Pro 與 Grok 3 即便未進行越獄，仍分別能重現 76.8% 與 70.3% 的文本。相較之下，OpenAI 的 GPT-4.1 對此展現出較高抗性，僅能重現約 4% 的內容。

若商業 AI 服務可依需求輸出大量小說原文，權利持有人可能主張該服務實質上構成未經授權的內容分發管道，而非僅為抽象的「轉化」工具，進一步升高將受智慧財產權保護書籍納入訓練資料是否合法的爭論。

美國與歐盟政策制定者陸續草擬 AI 訓練與智慧財產權相關框架，產業人士警告，若未妥善保護媒體內容庫即用於 AI 訓練，恐引發系統性侵權風險。為降低相關爭議，模型供應商正導入更多過濾機制、拒絕策略，以降低模型記憶化內容的可能性。不過，資安研究人員也指出，具針對性的對抗式提示，仍時常能繞過這些防護措施。