洛斯阿拉莫斯國家實驗室推出 PAS 工具,即時揪出視覺語言模型「自說自話」的幻覺輸出

作者 | 發布日期 2026 年 06 月 13 日 10:30 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
洛斯阿拉莫斯國家實驗室推出 PAS 工具,即時揪出視覺語言模型「自說自話」的幻覺輸出

洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)研究團隊近日提出一項名為 Prelim Attention Score(PAS)的新工具,主打即時偵測視覺語言模型是否出現「幻覺」輸出,也就是模型描述了圖片中不存在、或與影像內容不一致的物體與資訊。這項方法可在模型運作過程中同步監測,協助判斷答案究竟是根據影像生成,還是過度依賴自身先前產生的文字。

研究人員指出,PAS 可直接套用在既有主流視覺語言模型上,幾乎不需要額外運算成本,因此具備「即插即用」特性。洛斯阿拉莫斯電腦科學家曼尼什·巴塔拉(Manish Bhattarai)表示,PAS 具備即時監測能力,能以低額外運算負擔提升多模態 AI 的安全性與可信度,並在偵測幻覺方面達到先進水準。

PAS 的運作方式,是追蹤自迴歸式視覺語言模型在逐步生成每個 token 時,注意力主要來自影像、文字提示,還是模型自己前面已生成的詞句。當系統對某個物件的描述過度倚賴前文時,PAS 就會給出提示分數;分數越接近零,代表越不可能出現幻覺輸出。洛斯阿拉莫斯實習生 Xuan Nhat Hoang 形容,這套工具是讀取 AI 已經產生的訊號,能在不增加太多負擔的前提下,找出模型開始「自說自話」的關鍵時刻。

團隊表示,PAS 未來可用於醫學影像、科學文件分析、工程圖面、遙測資料等需要嚴格驗證視覺內容的場景,避免不受支撐的影像陳述影響後續決策。這項研究在今年 6 月於丹佛舉行、由 IEEE 與 Computer Vision Foundation 主辦的 Computer Vision and Pattern Recognition(CVPR)2026 會議上發表,並獲洛斯阿拉莫斯實驗室的 Laboratory Directed Research and Development 計畫資助。

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》