Tag Archives: AI 模型

Meta Llama 4 模型引發基準測試爭議,LMArena 更新排行榜規則

作者 |發布日期 2025 年 04 月 09 日 14:45 | 分類 AI 人工智慧 , 軟體、系統

在最近的 AI 模型競爭中,Meta 的 Llama 4 系列引發廣泛的爭議。Meta 在週末出乎意料地推出了兩個新的 Llama 4 模型,分別是較小的 Scout 和中型的 Maverick。這些模型聲稱可以在多個廣為報導的基準測試中超越 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0 Flash。Maverick 迅速在 AI 基準網站 LMArena 上獲得第二名,這使得 Meta 的開放權重 Llama 4 看起來成為了對抗 OpenAI、Anthropic 和 Google 等封閉模型的有力競爭者。 繼續閱讀..

美中 AI 性能差距縮小至 0.3%,全球科技霸權之爭白熱化

作者 |發布日期 2025 年 04 月 09 日 9:30 | 分類 AI 人工智慧 , 科技政策

美國史丹佛大學最新《2025 年人工智慧指數報告》,美中人工智慧(AI)模型性能差距顯著縮小,從 2023 年雙位數降至僅 0.3%。報告揭示中國 AI 領域快速進展,尤其 AI 論文及專利產出,中國領先全球。儘管美國仍在尖端模型方面保持優勢,擁有 40 個與中國 15 個比較的先進模型,但兩國競爭愈發激烈。 繼續閱讀..

Meta Llama 4 未達市場預期,引發批評聲浪

作者 |發布日期 2025 年 04 月 08 日 10:30 | 分類 AI 人工智慧 , 軟體、系統

Meta 最近發表的 Llama 4 多模態 AI 模型引發廣泛的爭議與討論。儘管該模型在參數上看似強大,聲稱具備 10 億個 token 的上下文窗口,Meta 的 CEO 馬克·祖克柏(Mark Zuckerberg)甚至在社交媒體上為其宣傳,稱之為「Llama 4 日」,然而,隨之而來的用戶反饋卻是幾乎一致的負面評價,許多 AI 專家對其表現感到失望,認為其與 Meta 的宣傳存在巨大落差。 繼續閱讀..

聽吳恩達怎麼說:DeepSeek、Gemini 升級版要用哪個?

作者 |發布日期 2025 年 04 月 03 日 9:30 | 分類 AI 人工智慧 , 中國觀察 , 國際觀察

Google 發表 Gemini 2.5,DeepSeek-V3 模型升級,百度也開放與 OpenAI 一拚的新模型,基礎模型戰爭不再美國獨領風騷,中國已踏入戰場。看在 AI 大師吳恩達眼裡,基礎模型發展對應用層大有益處,但模型不只是科技真空產物,對社會也會產生影響。他如何解讀美中大模型之爭?他國企業該不該用 DeepSeek?他自己團隊選用模型的策略?可用 AI 打造應用嗎 ?吳恩達 3 月 26 日出席 AI EXPO Taiwan 2025 時都有解答。 繼續閱讀..

Google 機器人專用 AI 模型 Gemini Robotics,強化自主理解能力

作者 |發布日期 2025 年 03 月 24 日 7:20 | 分類 AI 人工智慧 , Google , 技術分析

Google 月中推出專為機器人設計 AI 模型,著眼提升機器人的互動、靈活與安全性。為強化機器人商用價值,現階段廠商於開發從擬人身體四肢,延伸至類人的心智思考,期能賦予機器人自主理解能力,完成新穎、複雜與多變的各式任務。 繼續閱讀..

AI 讀懂生命密碼!大規模 AI 模型進軍生物科技,將如何影響未來健康產業?

作者 |發布日期 2025 年 03 月 07 日 8:30 | 分類 AI 人工智慧 , 生物科技

Nvidia 與 Arc Institute 推出全球最大生物 AI Evo 2,學習了 9 兆個 DNA 片段,涵蓋 12.8 萬種生物,能一次分析完整細菌基因組或人類染色體。它可準確預測癌症突變、設計人工基因,並在 2,048 顆  NVIDIA 的 H100 型 GPU 上訓練,規模媲美頂級 AI。現在,Evo 2 免費開放,讓科學家更快開發新藥、研究基因,改變未來生物科技。

繼續閱讀..

AI 模型會「變壞」!不安全程式碼訓練就出現有害行為

作者 |發布日期 2025 年 03 月 04 日 8:30 | 分類 AI 人工智慧 , Big Data , 資訊安全

大型語言模型可如真人對答,不過安全性一直有爭議。新研究顯示,AI 模型用不安全程式碼微調訓練後,會表現意外有害行為,包括讚美納粹、鼓勵危險行為,甚至提倡人類應被 AI 奴役。這問題顯示就算 AI 開發商引入各種安全機制,仍有被濫用危險。 繼續閱讀..

密西根大學光傳輸晶片突破,有望終結 AI 數據傳輸瓶頸

作者 |發布日期 2025 年 02 月 13 日 15:15 | 分類 AI 人工智慧 , 光電科技

密西根大學帶領,聯合華盛頓大學、賓夕法尼亞大學及勞倫斯伯克利國家實驗室等多所頂尖研究機構攜手研發的全新晶片連接系統,用光波導取代傳統金屬電路,突破長期制約 AI 模型規模與訓練速度的「記憶牆」問題。計畫獲美國國家科學基金會未來半導體專案 200 萬美元補助,也取得 Google、惠普、微軟及 Nvidia 等業界巨頭指導合作。 繼續閱讀..

憑高效 AI 模型挑戰業界,研調機構這樣看 DeepSeek

作者 |發布日期 2025 年 02 月 12 日 16:35 | 分類 AI 人工智慧 , 國際觀察

調研機構 Counterpoint 今(12 日)指出 DeepSeek 近期推出 R1 與 V3 大型語言模型(LLMs)掀起業界熱議。兩款開源模型不僅展現卓越性能,在成本上更具顯著優勢,API 價格比ChatGPT o1 低達 96%,顛覆 AI 產業過往對高效能模型須依賴巨額資金與算力堆砌的認知。 繼續閱讀..