
AI 快速滲透現代人生活各層面,從語音助理、新藥研發到自動駕駛,幾乎無所不能。科學領域,AI 則能幫助處理巨量數據、加速發現,甚至提出科學假設。然而,AI 點子能像人類有突破與創新性嗎?最近《Science》期刊報導提及比較人類與 AI 想的科學假設,結果顯示 AI 可驗證性明顯不足。如何結合 AI 效率與人類洞察力,將是科學發展的關鍵。
為了比較 AI 與人類「假設對決」,史丹佛大學收集大量資料,並讓基於大語言模型(LLM)AI 找尋潛在規律並產生新假設,人類則提出另一組假說。所有假設都去辨識化,由實驗室 43 位研究員盲測以確保客觀性。顯示人類假設通常更具體、更貼近問題核心,驗證成功率也較高。AI 雖產生數量龐大但缺乏嚴謹可驗證性,有的表面看似合理,卻很難驗證。
人類更能跳脫框架
實驗結果顯示,人類假說有較高比例實驗證實有效。AI 產生假說時,傾向提出顯而易見、已有文獻支持,或邏輯合理但缺乏創意的觀點。人類更能跳脫框架,提出更大膽反直覺假設,正是突破性發現的起點。
這不代表 AI 對科學研究毫無用處。相反的,研究員認為 AI 扮演重要輔助角色。因 AI 就像永不疲倦的「文獻檢索專家」與「數據分析師」,迅速篩選數百萬篇論文,辨識人類忽略的微小關聯,並整合供科學家參考。科學家可發揮獨特創造力與判斷力,提出更高品質、更具價值的假設。
研究顯示 AI 仍處於發展初期,尤其需要創造性思維的領域。大型語言模型雖能模仿人類寫作風格,但原理仍是基於統計學與機率,故難產生有突破性、真正「新知」。此外,這項研究也提醒人們,AI 應用需謹慎與專業評估,過度依賴 AI ,可能導致科學研究陷入「重複循環」迴圈,無法真正創新。
人類直覺的優勢
人類提出假設時,除了基於數據資料,更包括對科學領域的理解、直覺與經驗,自然語言處理(NLP)領域,AI 產生假設乍看似乎比人類更有創意,但實測後,AI 平均創新性評分從 5.4 降至 3.4 分,很多看似新穎的想法實測時就站不住腳;人類假設則從 4.6 分降至 4.0 分,突顯人類假設可行性及解讀結果的優勢。
然而,AI 與人類創新性差距將逐漸縮小。技術更進步後,AI 將來仍可能負擔產生大部分科學假設,而人類執行無法自動化的步驟。但如果人類淪為「實驗機器」,是否喪失探索科學的樂趣?理想狀態可能是「人機協作」模式,AI 負責搜尋與初步產生假說,人類掌握最終決定、驗證與創新等判斷。這樣分工或許可重塑科學研究生態,讓人類將心力投注在真正無法取代的創造與洞見。
- The Ideation–Execution Gap: Execution Outcomes of LLM-Generated versus Human Research Ideas
- AI-generated scientific hypotheses lag human ones when put to the test
(首圖來源:shutterstock)