綜合港媒及中媒報導,由第三方機構 Nof1 最近發起了一項實盤測試,將六大 AI 大語言模型(LLM)分別注入 1 萬美元做為起始資金,令其在真實市場中自主交易。歷時 17 天,4 日第一屆「Alpha Arena」正式結束,阿里通義千問 Qwen 以 22.32% 的收益率奪得冠軍。
該競賽由Nof1於10月18日發起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大頂尖模型,每個模型擁有1萬美元初始資金,在真實市場上無人工干預地自主決策、交易,根據盈虧情況決出最後冠軍。
阿里巴巴旗下通義千問Qwen3-Max在最後關頭保持領先,以22.32%收益率奪得投資冠軍。Qwen和DeepSeek兩款中國模型也是唯二獲利的模型,而四大美國頂尖模型則全部虧損,GPT-5虧損逾62%墊底。

(Source:Nof1)
Alpha Arena目標是在一個動態、競爭的真實環境裡檢驗這些模型在「量化交易」領域的能力;研究團隊強調,這並不是為了「選出最強模型」,而是為了推動AI研究從靜態、考試式的基準測試轉向對「真實世界」、「即時決策」的考察。
(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)






