百度副總裁：文心大模型 3.5 版能力超越 ChatGPT 3.5

IT 之家 19 日引用網易科技報導，百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示，新一代大語言模型、生成式 AI（人工智慧）產品「文心一言」的新版本能力已超出 ChatGPT 3.5，為百度展開相關技術工作重要的里程碑；此外，IDC 最新發布「AI 大模型技術能力評估報告，2023」顯示，百度文心大模型 3.5 拿下 12 項指標的 7 個滿分，綜合評分第一、演算法模型第一、行業覆蓋第一。

據悉，IDC評估報告圍繞產品技術、服務生態及行業應用三大方面，考察大模型的十多項指標，中國國內主流大模型包括百度、阿里巴巴、騰訊、華為、科大訊飛、360、商湯等14家廠商參與本次評估。報告結果顯示，百度文心在模型能力、工具平台、生態布局及行業覆蓋上優勢明顯，並已提前進入商業化落實探索階段。

吳甜續指，百度自2019年開始深耕預訓練模型研發，先後發布知識增強文心系列模型；不久之前正式發布文心大模型3.5版本，進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創新，新版本在各項能力上均有明顯提升；尤其是百度擁有自研的深度學習平「飛槳」有力支撐了大模型的高效訓練和推理；飛槳與文心的協同優化，讓文心大模型3.5最新版本的模型效果提升50%，訓練速度提升2倍，推理速度提升30倍。

在大模型生態方面，吳甜指出，百度文心已形成企業、教育、社區三位一體的生態體系，最新數據顯示，百度有超過750萬開發者基礎，20萬企業生態基礎，多層次開展大模型人才培訓、企業賦能、開發者營運；百度並設立了10億人民幣創投基金鼓勵大模型創意、繁榮大模型生態。

不過，吳甜直言，目前大模型產業化仍面臨著巨大的挑戰，總結起來有三方面，首先是大模型的體積確實很大，帶來的訓練難度高、成本高；第二是對算力規模要求非常大，性能要求非常高；第三在於數據規模亦很大，收集、挖掘、建設、篩選、清洗這些數據，本身也是非常大的大工程，「大模型平台是價格昂貴的大算力系統，其實完全不需要存在大量的大模型，對於應用者而言也不需要每個應用都進行大模型的開發」。

對於「百模大戰」的終局預測，吳甜認為，過去短短幾個月時間，大量新的大模型出現，但這是個階段現象，未來各個企業和機構會逐漸找到自己的定位，接著會走向自己細分的方向，終局只會集中在少量的幾個大模型，但依託幾個少量大模型，會有非常廣泛的應用生態出現。

（本文由 MoneyDJ新聞授權轉載；首圖來源：shutterstock）