Tag Archives: 開源 AI 模型

DeepSeek-R1 模型背後的科學,AI 推理技術細節登《自然》

作者 |發布日期 2025 年 09 月 18 日 10:00 | 分類 AI 人工智慧 , 中國觀察

17 日,來自中國杭州的人工智慧新創公司 DeepSeek 的工程師們揭示了其開源 AI 推理模型 DeepSeek-R1 背後的深層科學。自今年 1 月發布以來,DeepSeek-R1 因採用創新的多階段訓練流程和開源透明策略,迅速成為 OpenAI 領先推理模型 o1-1217 的強勁競爭者。 繼續閱讀..

AI 新創 Deep Cogito 初試啼聲,開源 Cogito v1 模型表現直逼先進模型

作者 |發布日期 2025 年 04 月 11 日 7:40 | 分類 AI 人工智慧 , 新創 , 軟體、系統

人工智慧因開發成本過高,故門檻也高,但 DeepSeek 出現後,有更多挑戰者加入市場。舊金山 AI 新創 Deep Cogito 最近推出 Cogito v1 全新開源大型語言模型(LLM)系列,基於 Meta Llama 3.2 微調,有混合推理力,快速回答問題,或像 OpenAI 的 o 系列和 DeepSeek R1 能「反思」。 繼續閱讀..

聽吳恩達怎麼說:DeepSeek、Gemini 升級版要用哪個?

作者 |發布日期 2025 年 04 月 03 日 9:30 | 分類 AI 人工智慧 , 中國觀察 , 國際觀察

Google 發表 Gemini 2.5,DeepSeek-V3 模型升級,百度也開放與 OpenAI 一拚的新模型,基礎模型戰爭不再美國獨領風騷,中國已踏入戰場。看在 AI 大師吳恩達眼裡,基礎模型發展對應用層大有益處,但模型不只是科技真空產物,對社會也會產生影響。他如何解讀美中大模型之爭?他國企業該不該用 DeepSeek?他自己團隊選用模型的策略?可用 AI 打造應用嗎 ?吳恩達 3 月 26 日出席 AI EXPO Taiwan 2025 時都有解答。 繼續閱讀..

專家:開源 AI 模型或成軍事應用的更佳選擇

作者 |發布日期 2025 年 03 月 21 日 12:00 | 分類 AI 人工智慧 , 軍事科技 , 開放資料

最近舉行的新加坡國防高峰會,專家指開源人工智慧(AI)模型可能對軍事應用更安全。專家強調,當開源程式碼共享,整個 AI 社群能一起努力,使模型更安全堅固,引發對開源於軍事領域應用的廣泛討論,專家認為這種方式不僅增加透明度,還能促進創新和合作。 繼續閱讀..

DeepSeek R1 引發 AI 模型革命,美國晶片出口管制失敗了嗎?

作者 |發布日期 2025 年 02 月 03 日 7:45 | 分類 AI 人工智慧 , GPU , 半導體

美國長期以來透過出口管制與相關禁令,試圖限制中國取得最先進的人工智慧運算晶片,以維繫在全球 AI 發展領域的領先地位。然而近來中國新創公司 DeepSeek 公開宣稱,他們在較少晶片與較低預算的情況下,打造出表現能與美國前沿 AI 推理模型 ChatGPT o1 一較高下的 DeepSeek R1。由於他們公開了程式碼以外的資訊,使得從業界的競爭對手、到政界的白宮,都為了這個 AI 的橫空出世打到措手不及。

繼續閱讀..

元宇宙夢碎,AI 崛起:Meta 能靠 Llama 獲利嗎?

作者 |發布日期 2024 年 12 月 07 日 11:00 | 分類 AI 人工智慧 , Facebook , 元宇宙

還記得在 2021 年 10 月,Facebook 宣布改名 Meta,表示將致力打造元宇宙(Metaverse),但成果讓投資人、消費者大失所望。雖然 Meta 推出的虛擬實境平台「地平線世界(Horizon Worlds)」,朝實現元宇宙邁進了一步,但畫面糟糕、世界無聊,使用者寥寥無幾。Meta 董事長兼執行長祖克柏(Mark Zuckerberg)在地平線世界裡的虛擬替身更遭眾人嘲笑,讓人不禁認為祖克柏選錯了戰場。

繼續閱讀..