Tag Archives: AI 推理

蘇姿丰:AI 是 50 年來最重要科技,AI 無所不在時代正式來臨

作者 |發布日期 2026 年 05 月 22 日 11:15 | 分類 AI 人工智慧 , 半導體 , 財經

人工智慧(AI)技術突飛猛進,全球運算需求正在經歷前所未有的爆炸性成長。超微(AMD)董事長暨執行長蘇姿丰(Lisa Su)公開演活動指出,AI 發展已超越單純技術更新,正朝「AI 無所不在」願景邁進,這不僅將帶來龐大的商業利益,更將深遠造福全人類。

繼續閱讀..

六倍壓縮與零精度損失,Google TurboQuant 重寫 AI 推理規則

作者 |發布日期 2026 年 04 月 13 日 7:00 | 分類 AI 人工智慧 , Google , 技術分析

大型語言模型(LLM)應用規模持續擴張,推理階段的記憶體瓶頸已成為制約部署效益的核心問題。Google Research 3 月底發表的 TurboQuant 壓縮演算法,不重新訓練模型的前提下,大幅降低記憶體占用並提升運算效率,引發產業高度關注。

繼續閱讀..

從通用算力到極致專用:Hard-coded Inference 重塑 AI 推理的經濟邊界

作者 |發布日期 2026 年 03 月 19 日 7:00 | 分類 AI 人工智慧 , 半導體 , 技術分析

當前 AI 產業的重心已從早期模型訓練轉向推理端部署,此本質上為研發投入轉向營運獲利的商業過渡,訓練雖是高資本投入,但屬於低頻次的研發,推理卻是與營收直接連動的高頻成本中心,若單位 Token 成本無法最佳化,商業模式將難以存續。

繼續閱讀..