Tag Archives: 推理模型

「太難了,我不想了啦」蘋果研究質疑 AI 推理模型能力,在複雜問題面前「準確率歸零」

作者 |發布日期 2025 年 06 月 15 日 0:00 | 分類 AI 人工智慧 , Apple , 軟體、系統

在即將舉辦全球開發者大會(WWDC)前夕,蘋果公司提出一份研究報告,對目前最先進的 AI 推理模型能力提出質疑。研究指出,大型推理模型(LRMs)在面對高複雜度問題時,準確率會「完全崩潰」,甚至出現反常的思考退縮現象,顯示當前 AI 系統在推理與泛化能力上可能遭遇根本瓶頸。這份研究引發業界高度關注,有專家直言「任何認為 LLMs 就是實現 AGI 捷徑的人,都在自欺欺人」,警告當前 AI 技術發展可能已進入瓶頸。 繼續閱讀..

圖靈獎也納入 AI 版圖:2024 年得主為強化學習先驅 Andrew Barto 與 Richard Sutton

作者 |發布日期 2025 年 03 月 06 日 15:15 | 分類 AI 人工智慧

計算機學界的最高榮譽「圖靈獎」(A.M. Turing Award)今年頒給強化學習(Reinforcement Learning)奠基者 Andrew Barto 和 Richard Sutton(首圖右),表彰他們開創性的研究,為人工智慧鋪路。兩位研究者將共享 Google 資助的 100 萬美元獎金。 繼續閱讀..

「推理」AI 模型正當紅!中國 DeepSeek 發表效能媲美 OpenAI o1 的推理模型

作者 |發布日期 2024 年 11 月 27 日 8:10 | 分類 AI 人工智慧

隨著奉行「擴展法則」(Scaling Laws)的 OpenAI、Google 和 Anthropic 在效能突破上紛紛遇上瓶頸,市場開始紛紛轉而擁抱推理模型(reasoning model)。由知名中國私募巨頭幻方量化創立的 AI 研究公司 DeepSeek 在週三(11/20)發表 DeepSeek-R1 預覽版推理 AI 模型,並宣稱其推理能力與 OpenAI o1 不相上下。該公司並計劃對 DeepSeek-R1 開放原始碼並發布 API。 繼續閱讀..