字節跳動推新一代數學模型,推理能力效率顯著提升

作者 | 發布日期 2025 年 12 月 24 日 15:00 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
字節跳動推新一代數學模型,推理能力效率顯著提升

綜合中媒報導,字節跳動 Seed 團隊 24 日宣布推出新一代「形式化數學推理專用模型 Seed Prover 1.5」,透過大規模的 Agentic RL 訓練,其推理能力和推理效率宣稱取得顯著進步。

相較上一代模型,Seed Prover 1.5在16.5小時內,針對IMO 2025的前5道題目生成了完整可編譯驗證的Lean證明代碼,換算成績為35/42,達到之前IMO評分標準的金牌分數線。針對北美本科級別數學競賽Putnam,Seed Prover 1.5用時 9小時,對12道Putnam 2025賽題中的11道生成了可編譯驗證的Lean代碼。

(Source:Zheng Yuan

更系統的評估中,Seed Prover 1.5在完整的Putnam歷史評估集上解決了88%的問題,在代表碩士數學難度的Fate-H和代表博士生數學難度的Fate-X評估集上,分別解決了80%和33%的問題,刷新了形式化數學推理模型在這幾個評測集上的SOTA(State Of The Art)表現。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:科技新報)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》