Tag Archives: AI 模型

Google 新研究:AI 模型準確率最高僅 69%,答錯率高達三分之一

作者 |發布日期 2025 年 12 月 16 日 11:55 | 分類 AI 人工智慧 , Google , 資訊安全

Google 最新研究,目前人工智慧聊天機器人事實準確性還是項重大挑戰,最佳模型如 Gemini 3 Pro 準確率僅 69%。數據來自 Google 最新 FACTS 基準測試,即使最先進 AI,仍無法達 70% 準確率,這對需精準數據的行業如金融、醫療和法律來說,會造成嚴重後果。 繼續閱讀..

約翰霍普金斯大學研究:只要小小修改設計,AI 模型會更像大腦

作者 |發布日期 2025 年 12 月 11 日 7:40 | 分類 AI 人工智慧

約翰霍普金斯大學最新研究挑戰傳統人工智慧(AI)模型設計觀念,生物啟發結構可能在未經訓練下就能產生類似大腦的活動模式。論文發表於《自然機器智慧》期刊,顯示 AI 模型架構設計可能比耗時且昂貴的深度學習過程更關鍵。 繼續閱讀..

Nvidia 市值 4 兆美元仍怕破產?黃仁勳每週工作七天、凌晨四點查信「始終處於焦慮」

作者 |發布日期 2025 年 12 月 05 日 10:40 | 分類 AI 人工智慧 , Nvidia , 人力資源

輝達(Nvidia)首席執行長黃仁勳(Jensen Huang)近日在公開訪談中坦言,儘管 Nvidia 已成為全球最有價值的公司,他仍然每週工作七天,甚至在假期也不例外,因為他始終處於一種焦慮的狀態,擔心公司會破產。黃仁勳表示,他已經使用「距離破產 30 天」這句話 33 年,但這種脆弱感和不確定性始終伴隨著他。

繼續閱讀..

「妳是女性,不可能懂量子演算法」,開發者揭露 Perplexity AI 驚人性別偏見回應

作者 |發布日期 2025 年 12 月 04 日 7:20 | 分類 AI 人工智慧 , Perplexity

11 月初,一位名為 Cookie 的開發者與 AI 模型 Perplexity 進行了一次例行對話。Cookie 經常要求 Perplexity 閱讀她的量子演算法開發工作並撰寫 GitHub 的說明文件。身為 Pro 訂閱者,她使用該服務的「最佳」模式,這意味著它會根據需要選擇使用 ChatGPT 或 Claude 等底層模型。起初,這一切運行良好,但隨著時間推移,Cookie 感到 AI 開始忽視她的指示,並重複要求相同的資訊。 繼續閱讀..

不讓 DeepSeek 專美於前!月之暗面強勢崛起,中美 AI 競賽進入白熱化階段

作者 |發布日期 2025 年 12 月 01 日 10:50 | 分類 AI 人工智慧 , 中國觀察

今年,中國的人工智慧新創公司月之暗面(Moonshot AI)正迅速崛起,成為與美國前沿實驗室競爭的強勁對手,儘管 DeepSeek 仍然是中國 AI 雄心的代表。Moonshot AI 被列為中國「AI 虎」之一,最近推出的 Kimi K2 Thinking 推理模型,顯著提升了其在中國 AI 生態系統中的地位。 繼續閱讀..

百度新設基礎/應用模型研發部,強化 AI 布局

作者 |發布日期 2025 年 11 月 26 日 11:50 | 分類 AI 人工智慧 , 中國觀察 , 網路

綜合中媒報導,百度發布設立技術研發組織相關公告,新設基礎模型研發部,負責研發高智慧可擴展的通用人工智慧(AI)大模型,由吳甜負責;新設應用模型研發部,負責業務應用場景需要的專精模型調優和探索,由賈磊負責。王海峰繼續擔任CTO、TSC主席、百度研究院院長。以上部門均向百度CEO李彥宏彙報。 繼續閱讀..

Google 前 CEO 施密特:中國「免費開源」AI 恐成全球標準,美國閉源模式面臨地緣政治挑戰

作者 |發布日期 2025 年 11 月 12 日 16:10 | 分類 AI 人工智慧 , 國際觀察 , 開放資料

在最近的一集《Moonshots》Podcast 中,Google 前首席執行長艾瑞克·施密特(Eric Schmidt)表達了他對各國可能依賴中國開源人工智慧(AI)模型的擔憂。他指出,由於開源模型的免費特性,許多資金不足的國家可能會選擇使用這些模型、而非美國的封閉源模型。施密特表示,這種情況導致一個奇怪的結果:美國最大的模型是閉源的,而中國則是開源的。他強調,這樣的地緣政治問題在於,開源是免費的,而閉源模型則需要付費。 繼續閱讀..