字節跳動推擴散語言模型,推理速度提升 5.4 倍

作者 | 發布日期 2025 年 08 月 01 日 14:30 | 分類 AI 人工智慧 , 中國觀察 line share Linkedin share follow us in feedly line share
Loading...
字節跳動推擴散語言模型,推理速度提升 5.4 倍

綜合中媒報導,字節跳動 Seed 團隊宣布,推出實驗性擴散語言模型「Seed Diffusion Preview」,目標是以結構化的代碼生成為實驗領域,系統性驗證離散擴散技術路線做為下一代語言模型基礎框架的可行性。

實驗結果顯示,Seed Diffusion Preview的代碼推理速度可達2146 tokens/s,較同等規模的自回歸模型提升5.4倍。

(Source:字節跳動

Seed團隊指出,在實現高效採樣的同時,模型在多個代碼生成基準測試中,表現出與同規模自回歸模型相當的性能。另在代碼編輯(如CanitEdit等)這類需要全局視角規劃的任務中,模型展現了擴散模型框架的內在優勢,性能超過基於自回歸的模型,為解決更複雜的結構化推理問題提供了新的可能性。

Seed團隊續指,Seed Diffusion Preview驗證了離散擴散模型在大型語言模型上的推理加速潛力,並認為推理加速僅是此一技術路徑最直接的表層優勢。Seed Diffusion項目將致力於挖掘其更深遠的價值,持續探索其規模化定律與在複雜推理任務中的應用。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:ByteDance

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》