Tag Archives: AI 推論

企業棄「最強」投「最省」,高達 80% 算力將轉向平價小模型

作者 |發布日期 2026 年 06 月 10 日 12:10 | 分類 AI 人工智慧 , 國際觀察 , 軟體、系統

人工智慧產業近來正出現一項值得關注的變化:企業不再只追求最強模型,反而開始重新評估更便宜、規模更小的模型是否足以應付多數工作。這場轉向,可能改寫 AI 服務的成本結構,也將影響大型模型供應商未來的營收模式。 繼續閱讀..

代理 AI 重塑晶片架構!「成本才是王道」,ASIC、CPU 與記憶體牆成新戰場

作者 |發布日期 2026 年 06 月 10 日 8:01 | 分類 AI 人工智慧 , 記憶體

輝達(NVIDIA)執行長黃仁勳今年說過「推論 AI 時代才剛開始」,過去兩年 AI 運算需求已增加百萬倍,顯示產業正快速進入以推論為核心的新階段。這番說法也應證了近期業界走勢,從過去的追求算力轉移至高效推論,並穩步朝向「代理 AI」發展。 繼續閱讀..

從 SaaS 到 TaaS:AI 時代為何你不是付月費,而是 Token?

作者 |發布日期 2026 年 06 月 10 日 8:00 | 分類 AI 人工智慧 , 財經

還記得在今年 GTC Taipei 舞台上,Nvidia 執行長黃仁勳再次把外界目光拉回 AI 產業最核心的問題「AI 不只是模型競賽,更是一門圍繞算力、推論與 Token 展開的新經濟學」。當全球企業爭相導入生成式 AI、AI Agent 與自動化工作流,真正開始被重新定價的,不再只是軟體帳號或月費訂閱,而是每一次模型「思考」與「回答」背後所消耗的推論成本。

繼續閱讀..

AI 時代真正的大贏家可能不是 GPU!AMD 揭開 CPU 爆發性成長的關鍵五年

作者 |發布日期 2026 年 06 月 02 日 8:10 | 分類 AI 人工智慧 , IC 設計 , 半導體

過去幾年,全球半導體產業焦點幾乎完全集中圖形處理器(GPU)與生成式 AI 的軍備競賽。從高科技巨頭搶購 AI 伺服器,到各國競相建置大型語言模型,市場普遍認為 GPU 才是 AI 時代的核心推動力。然而,AMD 執行長蘇姿丰近日釋出最新訊號,指出中央處理器(CPU)正迎接一波意料之外的爆發性需求。 繼續閱讀..

AI 推動主流記憶體升級,HBF、HBM 將在 AI 推論協作提升效率

作者 |發布日期 2026 年 04 月 29 日 13:41 | 分類 AI 人工智慧 , 半導體 , 記憶體

資策會產業情報研究所(MIC)資深產業分析師楊可歆表示,AI 應用擴張不只帶動半導體市場規模快速成長,也使需求更集中於先進邏輯、高階記憶體、先進封裝與相關製造資源。隨著AI伺服器、企業導入、推論部署與主權 AI 建置同步擴大,半導體需求將由過去較為分散的終端應用,轉向以高階運算平台為核心的結構性成長。 繼續閱讀..

輝達宣告 AI 運算進入「推論拐點」,帶動長期算力擴張

作者 |發布日期 2026 年 04 月 21 日 15:40 | 分類 AI 人工智慧 , GPU , Nvidia

輝達(Nvidia)執行長黃仁勳在今年 GTC 大會上再度上修 AI 商機預測,估算 Blackwell 與 Vera Rubin 系統截至 2027 年的累計需求達至少 1 兆美元,較一年前約 5,000 億美元的預測翻倍。黃仁勳並表示,過去兩年 AI 運算需求已增加百萬倍,顯示產業正快速進入以推論為核心的新階段。 繼續閱讀..

市場質疑 AI 長期投資動能,輝達財報優於預期仍跌逾 5%

作者 |發布日期 2026 年 02 月 27 日 10:12 | 分類 AI 人工智慧 , Nvidia , OpenAI

CNBC 報導,輝達股價 26 日重挫超過 5%,市場焦點已從財報優劣轉向更核心的問題──人工智慧(AI)資本支出是否仍具長期可持續性,以及與 OpenAI 的投資合作案能否順利落地。儘管公司公布優於市場預期的季度財報,但在高估值與資本支出壓力背景下,投資人信心出現明顯鬆動。 繼續閱讀..

黃仁勳:AI 物理學時代,tokens 以每年五倍速成長

作者 |發布日期 2026 年 01 月 06 日 7:05 | 分類 AI 人工智慧 , IC 設計 , 半導體

輝達(NVIDIA)執行長黃仁勳在 CES2026 的主題演說中,描繪了一個由「物理 AI」與「AI 物理學」主導的新工業革命藍圖。他強調,這場革命將從根本上改變全球最龐大的實體產業,並宣布輝達下一代運算平台「Vera Rubin」已進入全面量產階段,以應對呈幾何級數爆炸成長的算力需求。

繼續閱讀..