在 Deepseek 掀起全球科技圈一陣波瀾後,各界都試圖從深度求索公布的文件中,找出他們如何成功的方式,韓國大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。
跳過 CUDA,Deepseek 用精細的 PTX 寫成 |
| 作者 Alan Chen|發布日期 2025 年 01 月 29 日 18:54 | 分類 AI 人工智慧 , 半導體 , 軟體、系統 |



