Tag Archives: DeepSeek

DeepSeek 新模型又有「蒸餾」痕跡,未經許可使用 Google Gemini 數據

作者 |發布日期 2025 年 06 月 05 日 16:40 | 分類 AI 人工智慧 , ChatGPT , Gemini

DeepSeek 稍早低調最新推理模型 R1-0528 數學和編程基準測試表現出色,但又引發以 Google Gemini 資料庫「蒸餾」訓練的質疑。研究員指出此模型語言模式和推理過程與 Gemini 2.5 Pro 極為相似,很可能是用「蒸餾」提升效能。 繼續閱讀..

華為昇騰晶片整合 DeepSeek 推一體機,效能最高約 H100 七成強攻中國市場

作者 |發布日期 2025 年 04 月 29 日 8:50 | 分類 AI 人工智慧 , 中國觀察 , 半導體

美中貿易戰,美國對中國人工智慧 (AI) 晶片出口管制越嚴格,日前甚至傳出川普政府也要管制降規版 H20 晶片出口,讓製造商輝達 (NVIDIA) 提列 55 億美元庫存損失。但中國 AI 市場需求依舊強烈,華為積極推出昇騰 (Ascend) 系列晶片填補市場空缺,最近出現華為昇騰系列晶片與 DeepSeek 模型結合的一體機分析文,市場可一窺性能與跟主流產品的差異。

繼續閱讀..

百度發布兩款新 AI 大模型,主打多模態/低成本

作者 |發布日期 2025 年 04 月 25 日 15:15 | 分類 AI 人工智慧 , 中國觀察

綜合港媒及中媒報導,在今日的「百度 Create 開發者大會」,百度創辦人李彥宏正式發布文心大模型 4.5 Turbo 及 X1 Turbo ,主打多模態、強推理和低成本,且認為多模態將是未來基礎大模型標準配置及目前用戶需求所在,相信相關市場規模將持續成長;當下的部分模型,仍存在模態單一、幻覺高、速度慢和價格貴等問題,而上述兩款新模型,正是為了解決這些問題。 繼續閱讀..