
市場消息傳出,中國 AI 公司正實施「多晶片混合」來提高人工智慧能力,透過捆綁不同供應商的 GPU,滿足AI 訓練需求並規避美國制裁。
多晶片方法有諸多優勢,包括利用多個 GPU 並行訓練,提高大語言模型(LLM)訓練速度,因同時處理更多數據,可更好利用記憶體,中國廠商可不完全依賴昂貴的 NVIDIA 晶片,進而降低成本。
美國為了避免技術流向中國,祭出許多出口限制,包括今年吊銷華為 8 張出口許可證。對此,中國公司必須解決這一問題,而華為昇騰(Ascend)系列 AI 處理器是該國唯一可用的 AI 晶片,但傳出昇騰 910B 晶片產量方面遇到問題,使生產時間拉長,價格也更高。
從中美晶片大戰以來,中國 GPU 變得非常糟糕,並出現針對 NVIDIA AI GPU 的地下走私網路。然而,這些黑市供貨有限,價格又昂貴,企業必須從本土晶片(如華為)或未經許可晶片(如老一代 GPU)來補齊供應問題。
目前中國公司已經開始開發「多晶片混合」技術,將不同晶片組成一個訓練集群,包括百度和阿里巴巴都在研究這項解決方案。但也面臨諸多挑戰,例如需要像 NVIDIA NVLink 這樣的高速架構,確保不同的加速器能高效通訊。不過,阿里巴巴雲就放棄這種方式,轉而使用基於乙太網的高性能網路。
(首圖來源:shutterstock)