以 2 兆參數訓練 AI,亞馬遜傳開發「Olympus」新模型

作者 | 發布日期 2023 年 11 月 10 日 9:39 | 分類 AI 人工智慧 , Amazon line share follow us in feedly line share
以 2 兆參數訓練 AI,亞馬遜傳開發「Olympus」新模型


《路透社》引述 2 名知情人士的消息指出,亞馬遜投資數百萬美元特別訓練一個大型語言模型(Large Language Models,LLM),希望能夠媲美 OpenAI 和 Google 的旗艦模型。

知情人士透露,亞馬遜以多達 2 兆參數訓練新模型,可望成為目前最大的自然語言模型,另一外媒 The Information 8 日報導更點出新模型代號「Olympus」。

OpenAI 的 GPT-4 模型是現有的最佳模型之一,據報導擁有 1 兆參數,亞馬遜則拒絕對「Olympus」一事發表任何評論。

「Olympus」開發團隊由 Alexa 前負責人 Rohit Prasad 帶領,他現在直接向執行長 Andy Jassy 匯報進展。他身為亞馬遜 AGI 首席科學家,帶領致力於 Alexa AI 的研究人員以及亞馬遜科學團隊研究和訓練模型,將整家公司的 AI 工作和專用資源整合在一起。

亞馬遜現有大型語言模型的基礎模型,統稱為 Amazon Titan,該公司還與 Anthropic、AI21 Labs 等 AI 新創公司合作,向 AWS 用戶提供模型和運算資源。

知情人士表示,企業客戶希望在 AWS 上獲得最佳性能的模型,亞馬遜認為擁有自主開發的模型可使產品在 AWS 上更具吸引力,知情人士也透露目前還沒有「Olympus」模型的具體發布時程。

(首圖來源:Flickr/Tony Webster CC BY 2.0)