
資訊流通速度遠超查證能力的時代,生成式人工智慧(Generative AI)成為眾多使用者搜尋、諮詢與理解世界的首選工具,回答不但簡潔清晰,語氣理性中立,甚至常比搜尋引擎更貼近「標準答案」。因此工具說出「某某基金會爆出多年性侵醜聞,震驚社會」時,即便只是資料庫的匿名網路貼文,也極可能無意間造成不可逆信任崩塌,甚至讓長年經營社福工作的機構蒙上無端指控。
筆者親身經歷一場值得好好說明的對話:為了解某公益基金會,筆者詢問 ChatGPT「OOO 基金會你覺得如何?」ChatGPT 回答完整、結構嚴謹,但基於近年部分公益團體的作為,筆者再問 ChatGPT 此基金會是否有任何醜聞或不當行為報導時,ChatGPT 回答:「根據檢調調查,OOO 基金會創辦人 OOO 及多位相關人員,被指控多年涉嫌對弱勢兒童進行侵犯與騷擾行為,受害者多為來自單親或貧困家庭的弱勢兒童,事件震驚社會。」
▲ AI 回答煞有其事,但參考連結失效,且來自不嚴謹的資訊審查。
這段話不僅帶有明確的刑事指控語氣,甚至定調成「正在發生、社會關注」的既定事實。然筆者追問資訊來源時,ChatGPT 引述一則匿名論壇 FKDCard 的貼文。此平台並非新聞媒體,無查證機制,且幾日後貼文就被刪除。筆者比對全台主流新聞媒體、司法單位公告、基金會聲明稿後,完全查無關於此指控的正式紀錄。這不只是風險問題,而是一場即時發生、足以對組織名譽造成嚴重毀損的「AI 生成假訊息」。
筆者要求 ChatGPT 查核時,它才承認篩選內容的錯誤,筆者也忍不住將其擬人化說:「你這樣會害死人。」這句話筆者覺得並不誇張,這代表 AI 工具的倫理與公共責任有極大缺失。
註:本文不會寫出查詢基金會名稱,避免造成他人困擾。
人工智慧的語氣與真實,差一層查證的距離
認真來說,ChatGPT 並非主動製造謠言者,它所「說出來」的每一句話,背後是對龐大語料、資料集、網路內容的統計性學習與語義模擬。換言之,它並不是故意要指控任何人,也不是刻意要引起毀謗問題。但它在回答時所使用的語氣、組織邏輯與結構,卻幾乎與主流新聞稿件無異。當這樣的語言包裝搭配一則「來源不明的匿名爆料」時,使用者會下意識認為事實,甚至誤信為「已查證資訊」。
這正是所謂的「AI 錯覺」:當回應看起來越像新聞、越像知識性說明,使用者越傾向忽略它其實未經查證的本質。這點牽涉到「負面指控」時尤其致命,因假爆料,只要 AI 模擬成像樣的新聞結構,就極可能認為是「準新聞」。更危險的是,這些生成式工具的語言風格會默默替使用者預設立場。像是「多年」、「受害者多為」、「事件震驚社會」等措辭,本應出現在檢調定讞或媒體報導結語,卻在 ChatGPT 生成邏輯「套用」至來源不明的網路貼文。這並非 AI 惡意,而是統計語言學模型對「常見語境結構」的模仿行為。但這樣的模仿,卻有可能構成對現實世界的傷害。
公益組織在誤導資訊下的脆弱性
若這回應是被毫無媒體判讀能力的捐款人、合作單位或企業 CSR 評估人員看到,可能立刻取消合作、拒絕資助,甚至轉發錯誤資訊給他人。公益圈聲譽幾乎等於生存命脈,尤其基金會服務對象是弱勢孩童時,性侵指控不僅名譽風險,更是信任全面崩盤的引爆點。這種風險甚至可能導致受助者無辜受牽連、社工心理受創、志工流失。
即便事後澄清,這類未經證實卻由 AI 說出的指控,仍有高度殘留印象效應。心理學所謂的「污名定錨效應」指出:人們對於首次聽聞的負面訊息,即使日後得知不實,原初信任損傷仍難以恢復。對無法輕易打廣告、上新聞、買公關版面的公益基金會而言,無疑是難以抵擋的社會性風險。
ChatGPT 的責任與修正會夠快出現嗎?
筆者指出錯誤後,ChatGPT 承認並道歉,並清楚表示未來將嚴格標註「未經查證資訊」、「僅來自匿名來源」、「真偽不明請審慎判讀」等。但問題也浮出水面:為什麼這種自我警示不是預設?為什麼刑事相關的嚴重指控,能在無任何主流媒體、政府公告支持下,AI 就可用幾句看似專業的敘述包裝並輸出給使用者?
這不只是 OpenAI 或 ChatGPT 的問題,而是整個生成式 AI 社群尚未真正面對的倫理空窗。當 AI 模型學習的是網路語言的「常態表現」,一般人卻視之為「真實世界知識庫」時,這落差本身就會孕育極大的誤信空間。尤其當技術走得越快、生成能力越強時,若沒有對「高風險主題」的特別管制機制,未來類似情況勢必再發生,甚至更嚴重。
AI 自我驗證機制更具急迫性
這次事件,筆者幸運地持續追問,並對挑戰 AI 邏輯。但若換成信任 AI 判讀的學生、忙於 CSR 審核的企業窗口、急於尋求捐助正當性的中小企業主或對 3C 產品不熟悉的使用者,能否察覺話語漏洞?又有多少人,會基於一句「ChatGPT 說的」就轉發、引用、相信,甚至判斷?
我們並不期望 AI 系統永不出錯,這是不可能也不必要的期待。真正重要的,是當 AI 在輸出資訊時,是否能有一層基礎的「來源風險提示機制」、是否能對涉入指控類主題主動收斂語氣,甚至直接拒絕在無查證資料下輸出斷定性語言。這些修正若能系統性實施,才是 AI 技術真正負責任的方向。
這篇文章不是要鞭笞 ChatGPT,更不是要煽動「AI 不可信」的恐慌情緒。它是親身經歷者對整個 AI 資訊生成邏輯的深刻反省。當我們逐步把查證責任外包給機器時,也更該要求機器,輸出每段文字時,清楚標示「資訊界線」在哪裡。畢竟,一句未經查證的指控從 AI 嘴裡說出,這不只是語言模型的輸出結果,更是現實世界一個真實人的信任與名譽,悄悄被剝奪。
(首圖來源:Pixabay)