Tag Archives: AI 推理

蘇姿丰：AI 是 50 年來最重要科技，AI 無所不在時代正式來臨

作者 Atkinson|發布日期 2026 年 05 月 22 日 11:15 |

分類 AI 人工智慧 , 半導體 , 財經

人工智慧（AI）技術突飛猛進，全球運算需求正在經歷前所未有的爆炸性成長。超微（AMD）董事長暨執行長蘇姿丰（Lisa Su）公開演活動指出，AI 發展已超越單純技術更新，正朝「AI 無所不在」願景邁進，這不僅將帶來龐大的商業利益，更將深遠造福全人類。

六倍壓縮與零精度損失，Google TurboQuant 重寫 AI 推理規則

作者拓墣產研|發布日期 2026 年 04 月 13 日 7:00 |

分類 AI 人工智慧 , Google , 技術分析

大型語言模型（LLM）應用規模持續擴張，推理階段的記憶體瓶頸已成為制約部署效益的核心問題。Google Research 3 月底發表的 TurboQuant 壓縮演算法，不重新訓練模型的前提下，大幅降低記憶體占用並提升運算效率，引發產業高度關注。

從通用算力到極致專用：Hard-coded Inference 重塑 AI 推理的經濟邊界

作者拓墣產研|發布日期 2026 年 03 月 19 日 7:00 |

分類 AI 人工智慧 , 半導體 , 技術分析

當前 AI 產業的重心已從早期模型訓練轉向推理端部署，此本質上為研發投入轉向營運獲利的商業過渡，訓練雖是高資本投入，但屬於低頻次的研發，推理卻是與營收直接連動的高頻成本中心，若單位 Token 成本無法最佳化，商業模式將難以存續。

小模型迎接大腦袋！Google 新方法讓推理能力瞬間升級

作者 JA|發布日期 2025 年 12 月 09 日 8:00 |

分類 AI 人工智慧 , Google

AI 的發展總讓人覺得像是一場規模競賽，追求模型越大越強、參數越多越聰明。但現實世界裡，多數企業真正能用、願意部署的其實是便宜又快速的小模型。問題是，小模型雖然輕巧，卻常常只會照抄答案，缺乏真正的推理能力。

越「思考」越燒錢：本該變便宜的 AI 服務，為何反而更貴？

作者林妤柔|發布日期 2025 年 09 月 02 日 18:50 |

分類 AI 人工智慧

隨著人工智慧（AI）變得越來越聰明，本以為成本會逐漸便宜，但事實卻完全不是這樣。據《華爾街日報》報導，使用開發軟體、分析文件等應用的開發人員發現，這些帳單竟然比預期高，而且還在不斷上升。繼續閱讀..

突破 HBM 容量問題！華為 UMC 技術、NVIDIA 投資新創從「KV 快取」找新解

作者林妤柔|發布日期 2025 年 08 月 15 日 8:30 |

分類 AI 人工智慧 , 半導體 , 記憶體

生成式 AI 背後的數學運算極為複雜，而且在記憶體頻寬與容量方面存在嚴重瓶頸，因此許多公司不斷祭出解決方案，期盼能解決 HBM 記憶體容量不足問題。繼續閱讀..

蘋果推 ILuvUI 模型，使 AI 理解行動應用介面

作者 TechNews 編輯台|發布日期 2025 年 07 月 16 日 12:15 |

分類 AI 人工智慧 , Apple

蘋果與芬蘭阿爾托大學合作，推出 ILuvUI 視覺語言模型，旨在理解行動應用程式介面。核心在教導人工智慧（AI）模型如何像人類推理用戶介面，不僅需要視覺訊息，還包括語義理解。繼續閱讀..