商用 AI「答錯比不回答更有風險」，Appier 前瞻研究教 AI 有自知之明

當 AI 越來越會回答、越來越能執行，企業真正擔心的是「AI 可不可以被信任」。許多 AI 系統即使不知道答案，仍會給出看似自信的回覆，但進入商業場景，這不只是體驗問題，恐怕會釀成營運危機。Appier 透過前瞻研究與技術創新，讓 AI 學會在關鍵時刻精準提問、進行風險評估、掌握自身能力邊界，已將相關能力注入產品線。

Appier 鎖定四大阻礙企業導入 AI 的關鍵挑戰：第一，模型在微調後雖能強化特定任務表現，卻可能因此「忘記」原有邏輯能力；第二，AI 遇到模糊指令會盲目猜測，但過度追問又會造成使用者負擔；第三，AI 缺乏風險感知，難以依據情境判斷何時該答、拒答或反問使用者；第四，傳統信心校準只看單次回答對不對，無法真正衡量模型「是否具備解題能力」。提出解法讓 AI 懂得精準提問、評估風險，並有效掌握自身能力邊界，且能防止失憶。

針對精準提問，Appier 發現如果 AI 只靠主觀判斷，往往難以準確決定何時該問。透過導入可驗證的外部回饋，並在回答前由其他大型語言模型交叉驗證，能讓 AI 問得準確、問得更有必要，讓任務精準度與使用者體驗之間的平衡效益提升超過三成。

面對風險評估，Appier 採用「技能拆解」方法，將解題、信心評估及期望值決策分開處理，讓 AI 能依據風險高低採取更理性的回答策略，將高風險預期虧損降低六至七成（以 AI 期望報酬數值計算）。

能力掌握方面，Appier 提出全新的能力校準機制，讓 AI 不只評估單次回答是否正確，回答前先預估答對機率，更準確界定能力邊界，其推論成本甚至低於 1 token。

至於模型微調後常見的失憶問題，Appier 提出穩定微調方法，從源頭辨識並迴避高困惑度 token，避免模型在強化新任務表現時遺忘既有的推理或指令遵循能力。研究顯示，這個方法已能將非目標任務的退化率降至接近 0%，且前處理時間只需 8 分鐘，有助於 Agentic AI 在企業場景更高效地持續學習與穩定落地。

研究成果已導入 Agent 產品中

這些研究與發現已整合在 Appier Agent 產品的實際運作流程。舉例來說，當消費者詢問美妝品牌的 AI 客服有關母親節「餐廳」推薦時，若 AI 沒有自覺力，很有可能迎合顧客、回答與品牌無關的資訊，甚至虛構商品，進而傷害品牌信任。反觀 Appier 提供的 Sales Agent 與 Service Agent 掌握自身能力範圍，不亂答不屬於自身專業的問題；當顧客提問資訊不足或條件不明確，也會先釐清、再回應，並在合適時機自然推薦相關商品，降低錯誤資訊與不當互動帶來的風險，同時有助於提升轉換率。

在企業內部營運場景，Appier 旗下 Audience Agent 同樣展現「可信任」重要性。當行銷人員要求 AI 為母親節活動規劃近 5 年、人數超過 10 萬的合適受眾時，若系統實際只能讀取 1 年資料，Audience Agent 不會為了迎合需求硬湊答案，而是如實提醒資料限制、主動釐清條件，提出可行替代方案並說明各方案優缺點，協助企業客戶降低營運決策風險。根據實際驗證結果，目前 Appier Agent 產品可為企業客戶成功阻擋 80% 風險回應，這個數字隨著數據迭代持續提升。

實際上，Appier 長期投入 AI 產學合作與前瞻研究，在國際頂尖學術期刊與研討會累計發表超過 400 篇論文，近年聚焦可信任的 Agentic AI 研究，接連獲得 NeurIPS、ACL、EMNLP 等國際權威學術會議肯定。上述研究成果讓 Appier Agent 產品對企業客戶而言更具說服力，幫助提升顧客體驗，也有助於減少企業的 token 消耗成本。

（首圖左起 Appier 個人化雲產品副總監林冠樺、執行長游直翰、AI 團隊研究科學家林玠言，來源：科技新報攝）