
綜合中媒及港媒報導,阿里巴巴開源了 ZeroSearch,這是一種無需與真實搜尋引擎互動即可激勵大模型搜尋能力的強化學習框架,其利用大模型預訓練知識轉化為檢索模塊,能動態控制生成內容品質。此外,在多個問答數據集上,其搜尋能力超過 Google 搜尋,且成本大幅降低。
研究人員在NQ、TriviaQA、PopQA、HotpotQA等7大問答數據集上進行了綜合評測。結果顯示,一個70億參數的監督微調模型使用ZeroSearch後,其搜尋能力達到了33.06;140億參數的模型則達到了33.97,超過了Google搜尋的32.47。
在成本方面,研究人員透過SerpAPI使用Google搜尋進行約6萬4,000次搜尋查詢的訓練,成本約為586.70美元;而在四個A100GPU上使用140億參數的大模型進行模擬時,成本僅為70.80美元,成本降低了80%以上。
(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)