馬斯克宣布打造 ChatGPT 競品!OpenAI CEO 潑冷水:GPT-5 可能大改

作者 | 發布日期 2023 年 04 月 20 日 8:30 | 分類 AI 人工智慧 , 軟體、系統 line share follow us in feedly line share
馬斯克宣布打造 ChatGPT 競品!OpenAI CEO 潑冷水:GPT-5 可能大改


當 ChatGPT 或新 Bing 輸入問題,AI 會調用雲端大腦思索後產生較合理的回答。OpenAI 開發 GPT 時也反覆提到參數太龐大,模型規模也每更新一代就更複雜。

訓練大規模語言模型,需要極大算力 GPU 集群,且隨用戶等比級數增長,運算時當然會占用相當算力,每家想入局 AIGC 的企業,最先考慮的是如何投資大規模雲端計算中心,彷彿 AIGC 競爭成為硬體資源角力場。

有了更強算力的計算中心,就能跑更大規模語言模型和演算法,最終 AI 產品可能也會更「聰明」。然最近 OpenAI CEO Sam Altman 至麻省理工演講,卻給想「大力出奇蹟」的後來者潑了盆冷水。

Altman:擴大模型規模已過時

「大模型時代已到盡頭,我們需要新思考和想法,讓 AIGC 更往前進。」

擴大模型規模,利用更複雜參數,調用更大算力,基本上是 OpenAI 過去幾年 GPT 的反覆運算法。GPT-2 約有 15 億參數,GPT-3 則有 1,750 億參數,GPT-4 雖沒有官方數據,但不少機構推測使用數兆字文本和上萬台伺服器,訓練成本超過 1 億美元。

ChatGPT 影響力越來越大,微軟也使用底層技術推出新 Bing。Google 不甘示弱推出 Bard,Adobe 推出 Firefly,除了大企業,矽谷許多資金充裕的新創 Anthropic、AI21、Cohere 和 Character.AI 都瘋狂投資,構建更大模型演算法,以追上 ChatGPT 和 OpenAI。

▲ 二代 Runway 一句話產生的大片。

對硬體資源需求極高,也造成輝達 A100、H100 GPU 搶購潮。eBay 的輝達 H100 是大熱門商品,價格更炒到 4 萬美元,官方定價 3.3 萬美元。且 H100 一般是打包 8 張組成一台伺服器銷售,也沒有第三方銷售 GPU 管道與輝達競爭,AI 浪潮下,誰的輝達 GPU 越多,彷彿就掌握 AIGC 的取勝之鑰。

與傳統業資本、大企業壟斷類似,算力追求更催生「算力壟斷」。Sam Altman 表示,OpenAI 還沒有開發 GPT-5 的計畫,言下之意是無腦擴大模型規模,並不會讓 GPT 保持無限反覆運算。

目前 ChatGPT 與微軟新 Bing 都遇到不少因算力不夠當機、服務不穩狀況。新 Bing 也並未開放所有使用者,仍需要排隊使用,也是 Google 無法將生成式 AI 完全引入搜尋的原因。曾在 Google 負責開發 AI,現在是 Cohere 創辦人的 Nick Frosst 也表示 Altman 很有先見之明,新人工智慧模型設計或架構可能會基於人類回饋調整,OpenAI 或許已開始從新方向構思 GPT-5 了。

馬斯克:挖人、買顯卡、組團隊

即便 Sam Altman 表示繼續走 OpenAI 老路,擴大模型規模提升 AI,很難追得上 ChatGPT,但曾是 Altman 老朋友的馬斯克還是投入 AIGC。華爾街日報報導,馬斯克悄悄註冊名為 X.AI Crop 的公司,並從 Google 挖角幾名研究員,向輝達買了幾千張顯卡。

馬斯克目的很明顯,就是為了與 OpenAI 和 Google 競爭。報導刊出後,馬斯克接受 Fox News 採訪時,承認想推出類似 ChatGPT 的產品,名為 TruthGPT,將「最大化尋求真理的 AI」,並試圖理解宇宙的本質,希望對人有更多益處而不是壞處。

馬斯克訪問有點無厘頭,畢竟從現在大型語言模型看,X.AI Crop 可能還不如矽谷新創團隊,TruthGPT 這名字也像與 ChatGPT 槓上。馬斯克一直認為 GPT-4 類生成式 AI 有相當高風險,呼籲暫停開發 6 個月,並推出監管方法,甚至說「它有毀滅文明的潛力」。

只是邊說暫停研究又邊成立 X.AI Crop 入局 AIGC,很難不相信馬斯克在炒作。暫停研發六個月,更像要 OpenAI 等馬斯克六個月時間追上進度。不可否認,馬斯克 SpaceX、特斯拉都顛覆業界,成為名氣最響亮的公司,所以離開 OpenAI 後看到其發展更好的發言,反而顯出馬斯克錯失機會的不甘。

至於 TruthGPT 能否像他說的,只能等六個月後見真章了。

黃仁勳:我們需要 App

生成式 AI 僅活在對話框內,以很古典的形式藏身所有智慧設備,不論外掛程式還是第三方 App,最終與人互動的都是對話框,這也是計算機剛出現時,最初的人機互動。

Nicolai Tangen 的 Podcast 與輝達 CEO 黃仁勳暢聊 AI 如何改變人們生活和工作。AI 快速發展,離不開輝達 GPU 助力,輝達幾乎壟斷雲端運算市場,Altman 觀點是 AI 還無法擺脫超高算力,超大型模型靠龐大演算法支援,對新創當然是大挑戰,對輝達也是。

輝達需不斷開發更強 GPU 滿足 AI 發展,且 AI 仍活在巨大資料中心內,需要許多台超級電腦提供算力,不像任何應用程式或軟體。GPT-3 有 1,750 億個參數,面對這種巨大計算量時,輝達 AI GPU 從底層重新設計,但目前處理大規模數據和學習大模型仍需數星期時間,還無法濃縮至單 App 或塞入 PC。

這其實解答了目前為止 AI 都是以雲端和外掛程式存在。輝達表示 AI 開始深入晶片設計,「當晶片架構師晚上睡覺,AI 仍不斷運算和最佳化改進架構,它能幫助我們設計和製造晶片。」

換句話說,AI 甚至介入晶片生產,這些晶片又用於雲端運算發展 AI,這算 AI 自給自足吧?黃仁勳認為 AI 會引發下次工業革命,雖暫時不會覺醒取代人類,反會極大解放人力,增加每人生產力,人們可用自然語言直接寫程式,無需學習複雜的 Python、Java、C 等程式語言。

▲ Github 的 Copilot 功能。

他也舉輝達軟體工程師為例,AI 幫助後約 40%~50% 程式和軟體交給生成式 AI 撰寫,工程師只要提供建議與想法。AI 加入後讓輝達軟體工程師生產效率提升 10 倍。AI 介入能讓人們以萬倍速度完成許多瑣事,間接提高生產力。GPT-4 出現前,AI 業可簡單靠擴大模型規模,增加硬體部署保持高速運算。但算力瓶頸出現,OpenAI 不得不重新思考如何最佳化,找到 AI 下一步方向。

黃仁勳也清楚知道,AI 算力需求太龐大,且要存在空間大、有許多晶片的地點,現在 AI 彷彿世界第一代電腦 ENIAC。AI 下一步是減少資源需求,也需要瘦身,且能獨立活在 App 或軟體內。目前看還不太現實,不過好消息是 OpenAI 開始招聘 Android、iOS 工程師,App 版 ChatGPT 或許就快到了。

(本文由 愛范兒 授權轉載;首圖來源:shutterstock)

延伸閱讀: