TikTok 中國母公司字節跳動(ByteDance)計劃開發一個新的人工智慧(AI)模型,選擇使用華為昇騰(Ascend)910B 晶片來訓練大型語言 AI 模型。
綜合消息人士的說法,字節跳動已將 Ascend 910B 主要用於運算密集度較低的 AI 推理,包括預先訓練的 AI 模型進行預測;訓練 AI 模型要求更高,需要大量資料,因此必須使用超高性能晶片,例如 NVIDIA 的 GPU。
據悉,以運算參數來衡量的話,新模型的能力和複雜性將不及字節跳動現有的 AI 模型豆包(Doubao)。TikTok 華盛頓特區發言人 Michael Hughes 代表字節跳動表示,這個前提是錯誤的,目前沒有任何新模式正在開發中。
根據知情人士的話透露,字節跳動今年已訂購超過十萬顆 Ascend 910B 晶片,但截至 7 月只收不到三萬顆,供貨速度過慢,無法滿足公司需求。與 NVIDIA 中國特規版晶片相比,華為的供應量和運算能力有限,因此字節跳動無法為新產品設定時間表。
字節跳動目前的 AI 技術包括 2023 年 8 月推出的大語言模型,之後更名為聊天機器人「豆包」,還有 AI 創作平台「即夢 AI」等多種應用。由於相關應用程式使用量增加,字節跳動成為華為 AI 晶片最大買家之一,同時也是 NVIDIA H20 最大買家。
過去也有消息稱,字節跳動正與博通合作,開發 5 奈米 AI 晶片,製造工作將交給台積電進行。
(首圖來源:字節跳動)