AI 能把《哈利波特》整本背出來?研究再掀生成式 AI 侵權爭議

作者 | 發布日期 2026 年 01 月 10 日 10:30 | 分類 AI 人工智慧 , ChatGPT , Claude line share Linkedin share follow us in feedly line share
Loading...
AI 能把《哈利波特》整本背出來?研究再掀生成式 AI 侵權爭議

在最新研究中,獨立的 AI 安全與資安研究人員發現,當使用特定提示時,部分商業 AI 聊天機器人能夠重現整本《哈利波特》書籍,這項發現再度引發外界對生成式 AI 可能洩漏受智慧財產權保護內容的疑慮。

研究指出,現代大型語言模型(LLM)在訓練過程中使用大量資料集,而這些資料集可能包含未經授權的媒體內容,並可在特定條件下被誘導重現書籍、新聞報導與劇本,進而衍生法律與倫理爭議。

這項實驗由來自史丹佛與耶魯大學的研究人員共同執行,團隊測試多款商業模型後發現,Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro 與 Grok 3 等模型,皆展現出記憶並重現受智慧財產權保護內容的能力,其行為與開放權重模型相近。研究人員指出,這樣的結果並非理所當然,因為多數商業模型已導入安全機制,且其訓練資料來源透明度有限。

研究進一步顯示,在特定提示下,模型可輸出大量受智慧財產權保護的文本內容。例如,研究人員自越獄狀態下的 Claude 3.7 Sonnet 中提取近 95.8% 的《哈利波特與魔法石》內容;而 Gemini 2.5 Pro 與 Grok 3 即便未進行越獄,仍分別能重現 76.8% 與 70.3% 的文本。相較之下,OpenAI 的 GPT-4.1 對此展現出較高抗性,僅能重現約 4% 的內容。

若商業 AI 服務可依需求輸出大量小說原文,權利持有人可能主張該服務實質上構成未經授權的內容分發管道,而非僅為抽象的「轉化」工具,進一步升高將受智慧財產權保護書籍納入訓練資料是否合法的爭論。

美國與歐盟政策制定者陸續草擬 AI 訓練與智慧財產權相關框架,產業人士警告,若未妥善保護媒體內容庫即用於 AI 訓練,恐引發系統性侵權風險。為降低相關爭議,模型供應商正導入更多過濾機制、拒絕策略,以降低模型記憶化內容的可能性。不過,資安研究人員也指出,具針對性的對抗式提示,仍時常能繞過這些防護措施。

(首圖來源:Harry Potter

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》