發表於《宇宙學與天文粒子物理期刊》的最新研究指出,人工智慧有望大幅加速人類尋找宇宙新法則的腳步,但也帶來出乎意料的難題:AI 有時懂太多,反而學不了新事物。
宇宙的標準答案還不夠完整
目前科學家描述宇宙的主流理論為「ΛCDM 模型」,它能解釋宇宙膨脹、星系分佈等大範圍現象,是當代宇宙學的基石。然而,科學家認為這個模型並非最終答案,近年天文觀測暗示,巨質量微中子、重力修正效應、隨時間變化的暗能量,都可能指向超越現有理論的新物理。
問題在於:要探索這些可能性,研究員必須建立數量龐大的「虛擬宇宙」電腦模擬,每個都對應不同物理假設,運算資源耗費量極其驚人,往往需要超大型電腦叢集跑好幾週。
「遷移學習」:讓 AI 先讀入門書
普林斯頓大學與弗萊特隆研究所嘗試用稱之為「遷移學習」(transfer learning)的機器學習突破這道瓶頸。概念很直接:不要讓 AI 一開始就硬啃最複雜的教材,而是先用相對簡單的 ΛCDM 模擬訓練它打好基礎,再逐步讓它學習包括新物理的複雜模型。
共同作者、宇宙學家 Adrian Bayer 生動比喻:「就像你要學一門困難學科,會先讀入門書建立概念,再去讀真正艱深的專門著作。」第一作者、普林斯頓大學大學部學生 Veena Krishnaraj 也說,這能避免 AI 一次「消化太多東西」。
但結果相當驚人:某些情形,遷移學習讓團隊昂貴模擬數量減少超過十倍,大幅降低運算成本與時間。
懂太多的代價:「負遷移」問題
然而,研究揭示一個隱藏陷阱,研究員稱之為「負遷移」(negative transfer)。還是用 Bayer 的比喻:想像從入門課本學醫的學生,某天遇到一種罕見疾病,症狀和常見病極為相似。過去累積的知識通常有幫助,但有時反而讓人做出錯誤判斷,先入為主將罕見病當成常見病處理。
AI 也會犯同樣毛病。團隊測試包含巨質量微中子模擬時就發現,微中子質量在宇宙留下的觀測訊號,和 ΛCDM 模型名叫「σ8」的參數(衡量物質在宇宙聚集程度的指標)效果非常相似。由於兩者「長相」幾乎一樣,預訓練過的神經網路起初根本分不清楚,常把新物理的訊號誤判為已知現象。
Krishnaraj 解釋:「負遷移並非隨機發生,而是源自模型背後的物理縮並性(degeneracy)。」換句話說,不同物理過程可能留下幾乎相同的宇宙印記,讓 AI 很難正確辨認哪個才是真正的原因。「這是我們必須留意並設法解決的問題。」
謹慎使用,因潛力巨大
此研究也像雙面刃,遷移學習確實能讓 AI 更快學習新宇宙模型,但如果運用不當,卻讓 AI 被舊知識束縛,錯過真正的新發現,正如論文所述:「預訓練能加速推理,但也可能阻礙學習新物理。」
這套方法仍在模擬階段驗證。團隊下步是用於真實天文觀測數據。下代宇宙巡天計畫即將生產前所未有的海量精確數據,若能謹慎運用遷移學習,科學家或許能用更少資源、更快速度,在浩瀚宇宙找到超越現有理論的新物理。
- AI Learned the Rules of the Universe and That Became a Problem
- AI could uncover new physics faster but there’s a surprising catch
(首圖來源:Pixabay)






