在數位時代,社群媒體上的使用者生成內容(UGC)雖被視為公眾可免費「瀏覽」,卻未必能免費「使用」。這個觀念正面臨嚴峻的法律挑戰。10 月下旬,Reddit 正式向 Perplexity AI 提起聯邦訴訟,指控該公司及其合作的三家數據抓取服務提供商,在 Reddit 明確要求停止後,仍持續非法獲取並利用其平台數據獲利。此案由紐約聯邦法院受理,核心指控為「有計畫、工業規模的數據盜竊」。
Reddit在訴狀中強調,價值數百億美元的AI企業對高品質訓練數據需求迫切,而Reddit正是此類數據的主要來源。訴狀更將數據抓取服務商比喻為「準銀行劫匪」──當無法直接突破Reddit的技術防護(「金庫」)時,便轉向隱蔽的生態系統(如Google搜尋結果,即「裝甲車」),透過隱藏身分與位置,繞過平台控制,大量獲取並販售包含Reddit內容的搜尋頁面。據指控,僅今年7月的兩週內,被告就訪問了近30億個此類頁面。
Reddit指控Perplexity為這個行動的主要受益者,稱其「為了獲取Reddit數據,似乎不擇手段……拒絕像競爭對手那樣與平台直接達成授權協議」。訴狀明確提及,Reddit已與Google、OpenAI等企業簽署數據授權合約,唯Perplexity未參與類似合作。
這並非Reddit首次採取法律行動捍衛數據權益。今年6月,Reddit曾對AI巨頭Anthropic提告,指控其在承諾停止後,仍逾十萬次未經授權存取Reddit伺服器數據。Reddit在2024年5月向Perplexity發送侵權警告信,後者當時聲稱遵守robots.txt協議且未使用Reddit內容訓練模型。然而,Reddit發現其平台內容被引用量隨後激增40倍。Reddit更設置僅對Google爬蟲開放的測試貼文,結果Perplexity在數小時內便「生成」了該貼文內容,似乎證實其數據來源與Reddit直接相關。
Reddit正積極為其最具價值的資產──使用者對話內容──建立法律護城河。平台價值不僅在廣告潛力,更在龐大的UGC與關鍵討論。此次訴訟,旨在鞏固「人類對話」的商業價值,迫使AI企業回到談判桌,為未來的數據授權經濟鋪路。
Reddit首席法律長Ben Lee指出,AI公司對高品質人類內容的競爭,催生了工業規模的「數據洗錢」經濟。Perplexity發言人Jesse Dwyer則回應,公司尚未收到訴訟文件,但「將持續為用戶自由、公平獲取公共知識的權利奮鬥」。
Reddit 2023年的API收費政策曾引發使用者大規模抗議,此次訴訟可視為該政策的延續與強化。案件結果將直接檢驗「數位千禧年著作權法」(DMCA)能否有效保護具商業價值的公共數據庫。無論判決為何,此案都將深刻影響AI時代消費者生成內容的價值與歸屬。
(首圖來源:Unsplash)






