憂內容遭盜用,紐時等媒體擋網路爬蟲 GPTBot

作者 | 發布日期 2023 年 08 月 31 日 16:40 | 分類 AI 人工智慧 , 數位內容 , 網路 line share follow us in feedly line share
憂內容遭盜用,紐時等媒體擋網路爬蟲 GPTBot


聊天機器人 ChatGPT 開發商 OpenAI 今年 8 月 8 日推出網頁爬蟲 GPTBot 以提升 AI 模型準確性後,包括「紐約時報」、路透社與彭博等愈來愈多媒體開始擋下這個網頁搜索工具。

法新社報導,除了美國有線電視新聞網(CNN)、澳洲廣播公司(ABC)外,法國24台(France 24)、法國國際廣播電台(RFI)、Mediapart、法國廣播電台(Radio France)與法國電視一台(TF1)等法國新聞媒體都跟進擋下這個爬蟲機器人。

法國廣播電台董事長維爾(Sibyle Veil)28日在記者會上說:「有件事是站不住腳的:這是未獲授權地竊取內容。」

抄襲檢測器Originality.ai指出,在GPTBot推出的短短兩個星期內,全球前1,000大網站中有近10%擋下GPTBot存取資料,包括網路零售商亞馬遜(Amazon.com)、生活知識網站Wikihow.com、線上問答網站Quora.com與圖片資料庫Shutterstock,預計這份名單上的網站每週還會增加5%。

OpenAI在官網上表示:「允許GPTBot出入你們的網站,可協助AI模型更加精確,並改善他們的一般性能與安全性。」但這個加州新創公司也提供如何阻擋GPTBot的方法。

法國廣播電台數位與創新策略主任佛里希(Laurent Frisch)告訴法新社:「他們沒有理由在沒有支付補償金的情況下取得我們的內容。」

法國24台與法國國際廣播電台母公司「法國世界媒體集團」(France Media Monde)數位空間主任佛勒利(Vincent Fleury)說:「我們受夠了被這些公司盜用內容,拿我們的產品牟利。」

GPTBot推出後,一些新聞媒體的內容與假消息扯上關係,法國媒體高層對此也表達擔憂,稱必須與OpenAI等生成式AI團體協商。

《費加洛報》(Le Figaro)新聞部主任兼線上服務出版商團體(Group of Online Services Publishers)總裁吉耶(Bertrand Gie)說:「媒體必須獲得公平的補貼額度。我們的期望是取得許可與支付協議。」

美國新聞通訊社美聯社今年7月與OpenAI達成協議,OpenAI可以使用美聯社回溯至1985年的檔案,美聯社則是取得OpenAI技術與AI專業知識的管道。

OpenAI也承諾投資500萬美元(約台幣1億6,000萬元)來協助擴大「美國新聞計畫」(American Journalism Project),並向這個非營利組織提供高達500萬美元的信貸,用以協助各大組織使用與部署AI技術。

由法新社、美聯社與甘尼特報團/今日美國報(Gannett/USA Today)等組成的新聞媒體集團,8月初發布一封公開信,說AI企業運用受版權保護的文字與影像來生成內容之前,須先徵求同意。

同時,這些組織表示,他們支持以負責任方式部署生成式人工智慧(generative AI)技術,但「必須發展一個法律架構,讓提供AI應用程式動力的內容素材有所保障,也讓傳達事實、推動民主的媒體可以繼續獲得公眾信任」。

(作者:張曉雯;首圖來源:shutterstock)