百度副總裁:文心大模型 3.5 版能力超越 ChatGPT 3.5

作者 | 發布日期 2023 年 07 月 20 日 10:15 | 分類 AI 人工智慧 , 中國觀察 line share follow us in feedly line share
百度副總裁:文心大模型 3.5 版能力超越 ChatGPT 3.5


IT 之家 19 日引用網易科技報導,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,新一代大語言模型、生成式 AI(人工智慧)產品「文心一言」的新版本能力已超出 ChatGPT 3.5,為百度展開相關技術工作重要的里程碑;此外,IDC 最新發布「AI 大模型技術能力評估報告,2023」顯示,百度文心大模型 3.5 拿下 12 項指標的 7 個滿分,綜合評分第一、演算法模型第一、行業覆蓋第一。

據悉,IDC評估報告圍繞產品技術、服務生態及行業應用三大方面,考察大模型的十多項指標,中國國內主流大模型包括百度、阿里巴巴、騰訊、華為、科大訊飛、360、商湯等14家廠商參與本次評估。報告結果顯示,百度文心在模型能力、工具平台、生態布局及行業覆蓋上優勢明顯,並已提前進入商業化落實探索階段。

吳甜續指,百度自2019年開始深耕預訓練模型研發,先後發布知識增強文心系列模型;不久之前正式發布文心大模型3.5版本,進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創新,新版本在各項能力上均有明顯提升;尤其是百度擁有自研的深度學習平「飛槳」有力支撐了大模型的高效訓練和推理;飛槳與文心的協同優化,讓文心大模型3.5最新版本的模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。

在大模型生態方面,吳甜指出,百度文心已形成企業、教育、社區三位一體的生態體系,最新數據顯示,百度有超過750萬開發者基礎,20萬企業生態基礎,多層次開展大模型人才培訓、企業賦能、開發者營運;百度並設立了10億人民幣創投基金鼓勵大模型創意、繁榮大模型生態。

不過,吳甜直言,目前大模型產業化仍面臨著巨大的挑戰,總結起來有三方面,首先是大模型的體積確實很大,帶來的訓練難度高、成本高;第二是對算力規模要求非常大,性能要求非常高;第三在於數據規模亦很大,收集、挖掘、建設、篩選、清洗這些數據,本身也是非常大的大工程,「大模型平台是價格昂貴的大算力系統,其實完全不需要存在大量的大模型,對於應用者而言也不需要每個應用都進行大模型的開發」。

對於「百模大戰」的終局預測,吳甜認為,過去短短幾個月時間,大量新的大模型出現,但這是個階段現象,未來各個企業和機構會逐漸找到自己的定位,接著會走向自己細分的方向,終局只會集中在少量的幾個大模型,但依託幾個少量大模型,會有非常廣泛的應用生態出現。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)