Reddit 控告 Perplexity AI 盜取使用者內容,AI 時代「數據洗錢」大戰揭幕

作者 | 發布日期 2025 年 10 月 27 日 9:50 | 分類 AI 人工智慧 , Perplexity line share Linkedin share follow us in feedly line share
Loading...
Reddit 控告 Perplexity AI 盜取使用者內容,AI 時代「數據洗錢」大戰揭幕

在數位時代,社群媒體上的使用者生成內容(UGC)雖被視為公眾可免費「瀏覽」,卻未必能免費「使用」。這個觀念正面臨嚴峻的法律挑戰。10 月下旬,Reddit 正式向 Perplexity AI 提起聯邦訴訟,指控該公司及其合作的三家數據抓取服務提供商,在 Reddit 明確要求停止後,仍持續非法獲取並利用其平台數據獲利。此案由紐約聯邦法院受理,核心指控為「有計畫、工業規模的數據盜竊」。

Reddit在訴狀中強調,價值數百億美元的AI企業對高品質訓練數據需求迫切,而Reddit正是此類數據的主要來源。訴狀更將數據抓取服務商比喻為「準銀行劫匪」──當無法直接突破Reddit的技術防護(「金庫」)時,便轉向隱蔽的生態系統(如Google搜尋結果,即「裝甲車」),透過隱藏身分與位置,繞過平台控制,大量獲取並販售包含Reddit內容的搜尋頁面。據指控,僅今年7月的兩週內,被告就訪問了近30億個此類頁面。

Reddit指控Perplexity為這個行動的主要受益者,稱其「為了獲取Reddit數據,似乎不擇手段……拒絕像競爭對手那樣與平台直接達成授權協議」。訴狀明確提及,Reddit已與Google、OpenAI等企業簽署數據授權合約,唯Perplexity未參與類似合作。

這並非Reddit首次採取法律行動捍衛數據權益。今年6月,Reddit曾對AI巨頭Anthropic提告,指控其在承諾停止後,仍逾十萬次未經授權存取Reddit伺服器數據。Reddit在2024年5月向Perplexity發送侵權警告信,後者當時聲稱遵守robots.txt協議且未使用Reddit內容訓練模型。然而,Reddit發現其平台內容被引用量隨後激增40倍。Reddit更設置僅對Google爬蟲開放的測試貼文,結果Perplexity在數小時內便「生成」了該貼文內容,似乎證實其數據來源與Reddit直接相關。

Reddit正積極為其最具價值的資產──使用者對話內容──建立法律護城河。平台價值不僅在廣告潛力,更在龐大的UGC與關鍵討論。此次訴訟,旨在鞏固「人類對話」的商業價值,迫使AI企業回到談判桌,為未來的數據授權經濟鋪路。

Reddit首席法律長Ben Lee指出,AI公司對高品質人類內容的競爭,催生了工業規模的「數據洗錢」經濟。Perplexity發言人Jesse Dwyer則回應,公司尚未收到訴訟文件,但「將持續為用戶自由、公平獲取公共知識的權利奮鬥」。

Reddit 2023年的API收費政策曾引發使用者大規模抗議,此次訴訟可視為該政策的延續與強化。案件結果將直接檢驗「數位千禧年著作權法」(DMCA)能否有效保護具商業價值的公共數據庫。無論判決為何,此案都將深刻影響AI時代消費者生成內容的價值與歸屬。

(首圖來源:Unsplash

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》