中國 AI 新創公司「深度求索」(DeepSeek)開發的大語言模型繞過美國人工智慧巨頭輝達(NVIDIA)的 CUDA 框架,據報導,DeepSeek 正為未來相容中國國產 GPU 晶片做準備。
香港星島日報網今天引述中媒報導,輝達「統一運算架構」(Compute Unified Device Architecture,CUDA)能大幅降低研發大模型的難度,獲全球開發商使用,使輝達擁有人工智慧(AI)界壟斷地位。
報導並引述美國科技網站指出,DeepSeek使用輝達的H800晶片訓練時,使用輝達底層硬體指令PTX(Parallel Thread Execution)語言,而不是高級編程語言CUDA。
北京航空航太大學副教授黃雷表示,繞過CUDA意味著DeepSeek可直接根據GPU驅動函數開發創新,以達成更細微操作。
DeepSeek有擅長寫PTX語言的開發者,若改用中國國產GPU,DeepSeek硬體相容會更得心應手,DeepSeek只要了解硬體驅動基本函數介面,即可仿照輝達GPU硬體程式設計介面寫程式,讓自家大模型更相容中國國產硬體。
(首圖來源:shutterstock)