回應《紐時》指控,OpenAI 主張合理使用公開資料訓練 AI

作者 | 發布日期 2024 年 01 月 09 日 14:51 | 分類 AI 人工智慧 , 數位內容 line share follow us in feedly line share
回應《紐時》指控,OpenAI 主張合理使用公開資料訓練 AI


《紐約時報》日前控告 OpenAI 及其主要投資人微軟在未經允許或付情況費下,使用數百萬篇受版權保護的新聞文章訓練生成式 AI,認為 OpenAI 明顯違反智慧財產權法。對此,OpenAI 8 日公開回應,稱其指控缺乏合理依據。

OpenAI 透過官方部落格發表聲明,重申使用網路上公開資料(包括《紐時》文章)訓練 AI 模型是「合理使用」。換句話說,建立 GPT-4 和 DALL·E 3 等生成式 AI 系統,OpenAI 認為從數十億個藝術品、電子書、論文等內容進行學習,以產生接近人類的文字和圖像,不需要取得許可或以任何方式支付費用。

「我們認為這項原則對創作者公平,對創新者必要,對美國競爭力相當關鍵」,OpenAI 寫道。

OpenAI 也試圖解決反芻(Regurgitation)問題,即生成式 AI 模型在某種提示方式下逐字輸出訓練資料,比方說產生一張與著名攝影師作品近乎相同的圖像。OpenAI 認為,來自單一來源訓練資料不太可能發生反芻,並期望使用者能夠負責任地使用服務,避免故意使 AI 模型進行反芻。

「有趣的是,《紐約時報》所引起的反芻似乎來自多年前文章,在多個第三方網站上大量擴散」,OpenAI 也寫道,「看起來他們故意操弄提示,通常包括冗長的文章摘錄,以便讓我們 AI 模型進行反芻。」

OpenAI 也揭露去年 12 月 19 日進行最後一次溝通,認為與《紐時》似乎取得建設性進展,談判重點圍繞 ChatGPT 即時顯示新聞來源的合作夥伴關係,OpenAI 使用者可以取得報導,《紐時》也獲得與既有讀者和新讀者建立聯繫的新方式。OpenAI 向《紐時》解釋,他們內容對現有模型訓練沒有實質貢獻,也不足以對未來訓練產生足夠的影響。然而《紐時》就在 12 月 27 日提起訴訟,這讓 OpenAI 感到訝異和失望。

值得一提的是,IEEE Spectrum 雜誌近日有篇文章,著名學者 Gary Marcus 和電影視覺藝術家 Reid Southen 共同展示包含 DALL·E 3 在內的生成式 AI 系統如何在沒有明確提示下反芻資料,這使 OpenAI 上述論點不太可信。

有關生成式 AI 版權爭論進入白熱化階段,OpenAI 仍然希望與《紐時》建立合作夥伴關係,尊重該媒體悠久歷史,同時期待與更多新聞出版業者合作。

(首圖來源:Unsplash

延伸閱讀: