比利時布魯塞爾自由大學(Vrije Universiteit Brussel,VUB)資料分析實驗室最新研究,商用大型語言模型首次證明獨立產生原創數學證明。團隊指出,OpenAI ChatGPT-5.2 Thinking 成功解開一個數學問題,並催生名為「vibe proving」的新 AI 推理法。
研究聚焦 2024 年 Ran 與 Teng 提出的假設。研究員說明,假設是根據規律或反覆出現的結果提出但尚未證明的命題;一旦完成有效證明,就會成為定理。團隊表示,整個證明過程歷經七次與 ChatGPT 對話,以及四版逐步演化論證,AI 主要負責探索可能路徑與構建證明架構,人類負責檢查推理是否正確完整。
作者之一、VUB 資料分析實驗室博士後研究員 Brecht Verbeken 表示,他早就懷疑 ChatGPT 也許能協助證明尚未解決的數學問題,但結果仍令人意外,因系統推理證明時效率相當高。VUB 教授 Vincent Ginis 指出,有助反駁外界認為 AI 創造力只能是重新排列組合訓練資料的看法。
團隊將此法命名為「vibe proving」,意指語言模型可協助整理與探索複雜理論想法,並思考能否像「vibe coding」迅速成熟。儘管 ChatGPT-5.2 證明架構發揮關鍵作用,研究者也強調,人類驗證仍不可或缺,尤其補齊細節與最終確認邏輯。
VUB 教授 Andres Algaba 認為,將來證明候選假設的速度有望更快,但瓶頸就變成人類驗證,語言模型也能協助這步驟。預印論文已於 2 月 21 日刊登在 arXiv,標題為〈Early Evidence of Vibe-Proving with Consumer LLMs: A Case Study on Spectral Region Characterization with ChatGPT-5.2 (Thinking)〉。
- For the First Time, ChatGPT Has Solved an Unproven Math Problem in Geometry
- Early Evidence of Vibe-Proving with Consumer LLMs: A Case Study on Spectral Region Characterization with ChatGPT-5.2 (Thinking)
(首圖來源:Pixabay)






