Reddit 控告 Perplexity AI 盜取使用者內容，AI 時代「數據洗錢」大戰揭幕

在數位時代，社群媒體上的使用者生成內容（UGC）雖被視為公眾可免費「瀏覽」，卻未必能免費「使用」。這個觀念正面臨嚴峻的法律挑戰。10 月下旬，Reddit 正式向 Perplexity AI 提起聯邦訴訟，指控該公司及其合作的三家數據抓取服務提供商，在 Reddit 明確要求停止後，仍持續非法獲取並利用其平台數據獲利。此案由紐約聯邦法院受理，核心指控為「有計畫、工業規模的數據盜竊」。

Reddit在訴狀中強調，價值數百億美元的AI企業對高品質訓練數據需求迫切，而Reddit正是此類數據的主要來源。訴狀更將數據抓取服務商比喻為「準銀行劫匪」──當無法直接突破Reddit的技術防護（「金庫」）時，便轉向隱蔽的生態系統（如Google搜尋結果，即「裝甲車」），透過隱藏身分與位置，繞過平台控制，大量獲取並販售包含Reddit內容的搜尋頁面。據指控，僅今年7月的兩週內，被告就訪問了近30億個此類頁面。

Reddit指控Perplexity為這個行動的主要受益者，稱其「為了獲取Reddit數據，似乎不擇手段……拒絕像競爭對手那樣與平台直接達成授權協議」。訴狀明確提及，Reddit已與Google、OpenAI等企業簽署數據授權合約，唯Perplexity未參與類似合作。

這並非Reddit首次採取法律行動捍衛數據權益。今年6月，Reddit曾對AI巨頭Anthropic提告，指控其在承諾停止後，仍逾十萬次未經授權存取Reddit伺服器數據。Reddit在2024年5月向Perplexity發送侵權警告信，後者當時聲稱遵守robots.txt協議且未使用Reddit內容訓練模型。然而，Reddit發現其平台內容被引用量隨後激增40倍。Reddit更設置僅對Google爬蟲開放的測試貼文，結果Perplexity在數小時內便「生成」了該貼文內容，似乎證實其數據來源與Reddit直接相關。

Reddit正積極為其最具價值的資產──使用者對話內容──建立法律護城河。平台價值不僅在廣告潛力，更在龐大的UGC與關鍵討論。此次訴訟，旨在鞏固「人類對話」的商業價值，迫使AI企業回到談判桌，為未來的數據授權經濟鋪路。

Reddit首席法律長Ben Lee指出，AI公司對高品質人類內容的競爭，催生了工業規模的「數據洗錢」經濟。Perplexity發言人Jesse Dwyer則回應，公司尚未收到訴訟文件，但「將持續為用戶自由、公平獲取公共知識的權利奮鬥」。

Reddit 2023年的API收費政策曾引發使用者大規模抗議，此次訴訟可視為該政策的延續與強化。案件結果將直接檢驗「數位千禧年著作權法」（DMCA）能否有效保護具商業價值的公共數據庫。無論判決為何，此案都將深刻影響AI時代消費者生成內容的價值與歸屬。