Tag Archives: DeepSeek-R1

DeepSeek-R1 模型背後的科學,AI 推理技術細節登《自然》

作者 |發布日期 2025 年 09 月 18 日 10:00 | 分類 AI 人工智慧 , 中國觀察

17 日,來自中國杭州的人工智慧新創公司 DeepSeek 的工程師們揭示了其開源 AI 推理模型 DeepSeek-R1 背後的深層科學。自今年 1 月發布以來,DeepSeek-R1 因採用創新的多階段訓練流程和開源透明策略,迅速成為 OpenAI 領先推理模型 o1-1217 的強勁競爭者。 繼續閱讀..

DeepSeek 更新 R1 模型,官方表示性能媲美 OpenAI o3

作者 |發布日期 2025 年 06 月 13 日 7:20 | 分類 AI 人工智慧 , GPU , 中國觀察

DeepSeek 5 月底發表大型語言模型升級版 DeepSeek-R1-0528 ,此次為小更新,數學推理、寫程式能力與內容準確性明顯提升,AIME 測試準確率達 87.5%,並降低模型產生幻覺機率。除開源外,新版支援 JSON 輸出與 Function Calling ,讓使用者更快整合至應用程式。 繼續閱讀..

DeepSeek 生態系迅速擴張,中國 AI 推理應用百花齊放

作者 |發布日期 2025 年 02 月 19 日 7:30 | 分類 AI 人工智慧 , 中國觀察 , 技術分析

DeepSeek 今年 1 月底公布並開源 DeepSeek-R1 模型後,大量中國廠商相繼宣布導入,使其生態系快速擴展。已有許多雲端平台上架 DeepSeek-R1 模型,含百度、阿里、騰訊、商湯、京東雲等;中國工信部公告中國三大電信商均導入技術,與通訊領域整合。

繼續閱讀..

DeepSeek R1 引發 AI 模型革命,美國晶片出口管制失敗了嗎?

作者 |發布日期 2025 年 02 月 03 日 7:45 | 分類 AI 人工智慧 , GPU , 半導體

美國長期以來透過出口管制與相關禁令,試圖限制中國取得最先進的人工智慧運算晶片,以維繫在全球 AI 發展領域的領先地位。然而近來中國新創公司 DeepSeek 公開宣稱,他們在較少晶片與較低預算的情況下,打造出表現能與美國前沿 AI 推理模型 ChatGPT o1 一較高下的 DeepSeek R1。由於他們公開了程式碼以外的資訊,使得從業界的競爭對手、到政界的白宮,都為了這個 AI 的橫空出世打到措手不及。

繼續閱讀..

微軟才說與 OpenAI 攜手要查深度求索,後腳將 DeepSeek-R1 拉上 Azure AI

作者 |發布日期 2025 年 01 月 30 日 20:04 | 分類 AI 人工智慧 , Big Data , Microsoft

微軟在這兩天宣布,中國 AI 公司 DeepSeek 所研發的 R1 模型納入 Azure AI 平台與 GitHub 工具。但不久前微軟才與 OpenAI 攜手表示,要調查 DeepSeek 是否有使用 ChatGPT o1 資料訓練的狀況。根據《路透社》報導,DeepSeek 在最近一週於行動應用程式商店的下載量急速攀升,截至本週一已超越 ChatGPT、總下載量突破 1,000 萬次,足見市場對該新興服務的高度關注。雖然 DeepSeek R1 以開放原始碼的方式問世,微軟卻在短短幾週內迅速將其整合至 Azure AI Foundry 與 GitHub,並且準備推出更小型的精煉版本,方便消費者在 Copilot Plus 個人電腦上離線執行。

繼續閱讀..