AI 快速學會宇宙法則，反而看不見新物理現象？

發表於《宇宙學與天文粒子物理期刊》的最新研究指出，人工智慧有望大幅加速人類尋找宇宙新法則的腳步，但也帶來出乎意料的難題：AI 有時懂太多，反而學不了新事物。

目前科學家描述宇宙的主流理論為「ΛCDM 模型」，它能解釋宇宙膨脹、星系分佈等大範圍現象，是當代宇宙學的基石。然而，科學家認為這個模型並非最終答案，近年天文觀測暗示，巨質量微中子、重力修正效應、隨時間變化的暗能量，都可能指向超越現有理論的新物理。

問題在於：要探索這些可能性，研究員必須建立數量龐大的「虛擬宇宙」電腦模擬，每個都對應不同物理假設，運算資源耗費量極其驚人，往往需要超大型電腦叢集跑好幾週。

普林斯頓大學與弗萊特隆研究所嘗試用稱之為「遷移學習」（transfer learning）的機器學習突破這道瓶頸。概念很直接：不要讓 AI 一開始就硬啃最複雜的教材，而是先用相對簡單的 ΛCDM 模擬訓練它打好基礎，再逐步讓它學習包括新物理的複雜模型。

共同作者、宇宙學家 Adrian Bayer 生動比喻：「就像你要學一門困難學科，會先讀入門書建立概念，再去讀真正艱深的專門著作。」第一作者、普林斯頓大學大學部學生 Veena Krishnaraj 也說，這能避免 AI 一次「消化太多東西」。

但結果相當驚人：某些情形，遷移學習讓團隊昂貴模擬數量減少超過十倍，大幅降低運算成本與時間。

然而，研究揭示一個隱藏陷阱，研究員稱之為「負遷移」（negative transfer）。還是用 Bayer 的比喻：想像從入門課本學醫的學生，某天遇到一種罕見疾病，症狀和常見病極為相似。過去累積的知識通常有幫助，但有時反而讓人做出錯誤判斷，先入為主將罕見病當成常見病處理。

AI 也會犯同樣毛病。團隊測試包含巨質量微中子模擬時就發現，微中子質量在宇宙留下的觀測訊號，和 ΛCDM 模型名叫「σ8」的參數（衡量物質在宇宙聚集程度的指標）效果非常相似。由於兩者「長相」幾乎一樣，預訓練過的神經網路起初根本分不清楚，常把新物理的訊號誤判為已知現象。

Krishnaraj 解釋：「負遷移並非隨機發生，而是源自模型背後的物理縮並性（degeneracy）。」換句話說，不同物理過程可能留下幾乎相同的宇宙印記，讓 AI 很難正確辨認哪個才是真正的原因。「這是我們必須留意並設法解決的問題。」

此研究也像雙面刃，遷移學習確實能讓 AI 更快學習新宇宙模型，但如果運用不當，卻讓 AI 被舊知識束縛，錯過真正的新發現，正如論文所述：「預訓練能加速推理，但也可能阻礙學習新物理。」

這套方法仍在模擬階段驗證。團隊下步是用於真實天文觀測數據。下代宇宙巡天計畫即將生產前所未有的海量精確數據，若能謹慎運用遷移學習，科學家或許能用更少資源、更快速度，在浩瀚宇宙找到超越現有理論的新物理。

（首圖來源：Pixabay）

想請我們喝幾杯咖啡？