字節跳動訓練新 AI 模型,傳採華為晶片、訂購數超過十萬顆

作者 | 發布日期 2024 年 09 月 30 日 16:01 | 分類 AI 人工智慧 , 中國觀察 , 晶片 line share Linkedin share follow us in feedly line share
字節跳動訓練新 AI 模型,傳採華為晶片、訂購數超過十萬顆


TikTok 中國母公司字節跳動(ByteDance)計劃開發一個新的人工智慧(AI)模型,選擇使用華為昇騰(Ascend)910B 晶片來訓練大型語言 AI 模型。

綜合消息人士的說法,字節跳動已將 Ascend 910B 主要用於運算密集度較低的 AI 推理,包括預先訓練的 AI 模型進行預測;訓練 AI 模型要求更高,需要大量資料,因此必須使用超高性能晶片,例如 NVIDIA 的 GPU。

據悉,以運算參數來衡量的話,新模型的能力和複雜性將不及字節跳動現有的 AI 模型豆包(Doubao)。TikTok 華盛頓特區發言人 Michael Hughes 代表字節跳動表示,這個前提是錯誤的,目前沒有任何新模式正在開發中。

根據知情人士的話透露,字節跳動今年已訂購超過十萬顆 Ascend 910B 晶片,但截至 7 月只收不到三萬顆,供貨速度過慢,無法滿足公司需求。與 NVIDIA 中國特規版晶片相比,華為的供應量和運算能力有限,因此字節跳動無法為新產品設定時間表。

字節跳動目前的 AI 技術包括 2023 年 8 月推出的大語言模型,之後更名為聊天機器人「豆包」,還有 AI 創作平台「即夢 AI」等多種應用。由於相關應用程式使用量增加,字節跳動成為華為 AI 晶片最大買家之一,同時也是 NVIDIA H20 最大買家。

過去也有消息稱,字節跳動正與博通合作,開發 5 奈米 AI 晶片,製造工作將交給台積電進行。

(首圖來源:字節跳動

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》