憂內容遭盜用，紐時等媒體擋網路爬蟲 GPTBot

聊天機器人 ChatGPT 開發商 OpenAI 今年 8 月 8 日推出網頁爬蟲 GPTBot 以提升 AI 模型準確性後，包括「紐約時報」、路透社與彭博等愈來愈多媒體開始擋下這個網頁搜索工具。

法新社報導，除了美國有線電視新聞網（CNN）、澳洲廣播公司（ABC）外，法國24台（France 24）、法國國際廣播電台（RFI）、Mediapart、法國廣播電台（Radio France）與法國電視一台（TF1）等法國新聞媒體都跟進擋下這個爬蟲機器人。

法國廣播電台董事長維爾（Sibyle Veil）28日在記者會上說：「有件事是站不住腳的：這是未獲授權地竊取內容。」

抄襲檢測器Originality.ai指出，在GPTBot推出的短短兩個星期內，全球前1,000大網站中有近10%擋下GPTBot存取資料，包括網路零售商亞馬遜（Amazon.com）、生活知識網站Wikihow.com、線上問答網站Quora.com與圖片資料庫Shutterstock，預計這份名單上的網站每週還會增加5%。

OpenAI在官網上表示：「允許GPTBot出入你們的網站，可協助AI模型更加精確，並改善他們的一般性能與安全性。」但這個加州新創公司也提供如何阻擋GPTBot的方法。

法國廣播電台數位與創新策略主任佛里希（Laurent Frisch）告訴法新社：「他們沒有理由在沒有支付補償金的情況下取得我們的內容。」

法國24台與法國國際廣播電台母公司「法國世界媒體集團」（France Media Monde）數位空間主任佛勒利（Vincent Fleury）說：「我們受夠了被這些公司盜用內容，拿我們的產品牟利。」

GPTBot推出後，一些新聞媒體的內容與假消息扯上關係，法國媒體高層對此也表達擔憂，稱必須與OpenAI等生成式AI團體協商。

《費加洛報》（Le Figaro）新聞部主任兼線上服務出版商團體（Group of Online Services Publishers）總裁吉耶（Bertrand Gie）說：「媒體必須獲得公平的補貼額度。我們的期望是取得許可與支付協議。」

美國新聞通訊社美聯社今年7月與OpenAI達成協議，OpenAI可以使用美聯社回溯至1985年的檔案，美聯社則是取得OpenAI技術與AI專業知識的管道。

OpenAI也承諾投資500萬美元（約台幣1億6,000萬元）來協助擴大「美國新聞計畫」（American Journalism Project），並向這個非營利組織提供高達500萬美元的信貸，用以協助各大組織使用與部署AI技術。

由法新社、美聯社與甘尼特報團／今日美國報（Gannett/USA Today）等組成的新聞媒體集團，8月初發布一封公開信，說AI企業運用受版權保護的文字與影像來生成內容之前，須先徵求同意。

同時，這些組織表示，他們支持以負責任方式部署生成式人工智慧（generative AI）技術，但「必須發展一個法律架構，讓提供AI應用程式動力的內容素材有所保障，也讓傳達事實、推動民主的媒體可以繼續獲得公眾信任」。

（作者：張曉雯；首圖來源：shutterstock）