Tag Archives: DeepSeek

DeepSeek 推可自驗證數學模型 DeepSeekMath-V2

作者 |發布日期 2025 年 11 月 28 日 14:15 | 分類 AI 人工智慧 , 軟體、系統

綜合港媒報導,DeepSeek 推出新型數學推理模型 DeepSeekMath-V2,採用可自我驗證的訓練框架。該模型在 2025 年國際數學奧林匹克競賽(IMO 2025)和 2024 年中國數學奧林匹克競賽(CMO 2024)中均達到金牌水準,並在 2024 年普特南數學競賽(Putnam 2024)中獲得近乎滿分的 118 / 120 分優異成績。 繼續閱讀..

研究指 AI 對中國有偏見,DeepSeek 模型歧視傾向竟然最嚴重

作者 |發布日期 2025 年 11 月 18 日 7:10 | 分類 AI 人工智慧 , Big Data , 網路

蘇黎世大學團隊近期於 Science Advances 發表研究,發現無論是美國、法國還是中國開發的大型語言模型(LLM),一旦評論文本被標示為「中國人」所寫,AI 對該文本評價分數會出現明顯下降,並非內容本身不合邏輯,而是單因國籍標籤產生重大偏見。這現象在中國的 DeepSeek Reasoner 模型尤其明顯,顯示偏見並非由開發國籍或政治立場主導,而是大規模語言模型難以完全消除的結構性問題。 繼續閱讀..

Google 前 CEO 施密特:中國「免費開源」AI 恐成全球標準,美國閉源模式面臨地緣政治挑戰

作者 |發布日期 2025 年 11 月 12 日 16:10 | 分類 AI 人工智慧 , 國際觀察 , 開放資料

在最近的一集《Moonshots》Podcast 中,Google 前首席執行長艾瑞克·施密特(Eric Schmidt)表達了他對各國可能依賴中國開源人工智慧(AI)模型的擔憂。他指出,由於開源模型的免費特性,許多資金不足的國家可能會選擇使用這些模型、而非美國的封閉源模型。施密特表示,這種情況導致一個奇怪的結果:美國最大的模型是閉源的,而中國則是開源的。他強調,這樣的地緣政治問題在於,開源是免費的,而閉源模型則需要付費。 繼續閱讀..

AI 大模型實盤投資競賽,阿里通義千問 Qwen 奪冠

作者 |發布日期 2025 年 11 月 04 日 16:15 | 分類 AI 人工智慧 , 軟體、系統

綜合港媒及中媒報導,由第三方機構 Nof1 最近發起了一項實盤測試,將六大 AI 大語言模型(LLM)分別注入 1 萬美元做為起始資金,令其在真實市場中自主交易。歷時 17 天,4 日第一屆「Alpha Arena」正式結束,阿里通義千問 Qwen 以 22.32% 的收益率奪得冠軍。 繼續閱讀..

矽谷菁英的「中國情結」:當效率體制成為美國科技業新信仰

作者 |發布日期 2025 年 10 月 27 日 7:40 | 分類 AI 人工智慧 , 中國觀察 , 科技政策

矽谷的科技菁英近來出現一種「中國情結」──在社群媒體、Podcast 訪談、產業簡報中,不少美國科技菁英大讚中國基礎建設的驚人速度、製造業的強大實力,以及中國新興人工智慧公司 DeepSeek 展現的創新能力。與此同時,他們反思美國老舊失修的基礎建設、繁複冗長的監管規定,以及一個「連螺絲釘、無人機乃至生產這些設備的機器都難以製造」的經濟體。這種對比讓矽谷從業者憂心美國正被中國超越,甚至引發一波要求效法中國的呼聲。

繼續閱讀..

AI 開發架構終局之戰:CUDA 帝國、Google XLA 聯邦與「第三勢力」的崛起

作者 |發布日期 2025 年 10 月 03 日 8:30 | 分類 AI 人工智慧 , Google , Nvidia

2025 年這個 AI 技術爆炸的時代,決定霸權歸屬的戰場,已從矽晶片的物理極限,全面轉移到其上的軟體生態系。當 NVIDIA 的 CUDA 帝國以其深不見底的護城河鞏固江山,Google 以 TPU 與 XLA 編譯器建立起高效的垂直聯邦時,一股「第三勢力」正悄然崛起。以 DeepSeek 為首的頂尖 AI 公司,開始將賭注押在如 TileLANG 這樣的新一代「可攜式性能語言」上,試圖從根本上瓦解硬體綁定的舊秩序。這場三方角力,不僅重新定義了 AI 開發的典範,更將深刻影響從雲端巨頭到台灣半導體產業的未來命運。 繼續閱讀..

降低 CUDA 生態系依賴,DeepSeek 新模型獲華為昇騰、寒武紀、海光支援

作者 |發布日期 2025 年 10 月 02 日 11:14 | 分類 AI 人工智慧 , 中國觀察 , 半導體

中國 AI 公司 DeepSeek 發表最新模型 DeepSeek-V3.2-Exp 之際,為華為昇騰(Ascend)晶片及其 CANN(Compute Architecture for Neural Networks)運算架構提供最佳化。此舉代表 DeepSeek 重心轉移,確保先進模型能在中國製 AI 加速器運行,不再一味依賴 NVIDIA CUDA 生態系。

繼續閱讀..

DeepSeek 又出陰人新招:遇到敏感關鍵字,程式缺陷率驟升至 42.1%

作者 |發布日期 2025 年 09 月 19 日 12:15 | 分類 AI 人工智慧 , 資訊安全

美國資安公司 CrowdStrike 最新研究,請 DeepSeek 寫程式,但遇到敏感字眼或地區時,品質會驟降。DeepSeek 對含伊斯蘭國(IS)字眼的要求,產生程式缺陷率幾乎是正常狀況兩倍達 42.1%,其他關鍵字還有法輪功、西藏和台灣。 繼續閱讀..

DeepSeek-R1 模型背後的科學,AI 推理技術細節登《自然》

作者 |發布日期 2025 年 09 月 18 日 10:00 | 分類 AI 人工智慧 , 中國觀察

17 日,來自中國杭州的人工智慧新創公司 DeepSeek 的工程師們揭示了其開源 AI 推理模型 DeepSeek-R1 背後的深層科學。自今年 1 月發布以來,DeepSeek-R1 因採用創新的多階段訓練流程和開源透明策略,迅速成為 OpenAI 領先推理模型 o1-1217 的強勁競爭者。 繼續閱讀..