
隨著 OpenAI、Anthropic 及大型科技公司在開發最先進的大型語言模型上投入數十億美元,有些 AI研究者正致力於下一個重大突破。這些研究者包括史丹佛大學的李飛飛(Fei-Fei Li)和 Meta 的 AI 科學家楊立昆(Yann LeCun),他們正在開發所謂的「世界模型」(World Models)。
與大型語言模型不同,世界模型根據人類對周圍世界的心理構建來預測事件,而不是僅依賴於訓練資料中單詞和短語之間的統計關係。
李飛飛在2024年共同創立了World Labs,並獲得來自Andreessen Horowitz、新企業協會和Radical Ventures等風險投資公司的2.3億美元初始資金。World Labs的目標是將AI模型從2D像素平面提升到完整的3D世界,賦予它們與人類一樣豐富的空間智慧,並更像人類的思考模式。
李飛飛認為,世界模型在創意領域、機器人技術或任何需要無限宇宙的領域都有應用潛力。這可能在軍事應用上帶來進展,幫助戰場上的人員更好地感知周圍環境並預測敵人的下一步行動。
在Meta,楊立昆也有一個小團隊專注於類似的項目。他們使用影片資料來訓練模型,並在不同層次上進行抽象影片的模擬。讓AI不是在像素層面進行預測,而是讓系統能在抽象層面上進行預測,而希望可以透過這個模式去除所有難以預測的細節。
楊立昆和李飛飛都認為,這些模型是創造真正超越人類思維AI的唯一途徑。他們強調,AI系統需要能夠快速學習新任務,理解物理世界,而不僅僅是文本和語言,還要具備一定的常識、推理和規劃能力,以及持久的記憶。
- Top AI researchers say language is limiting. Here’s the new kind of model they are building instead.
- World Modeling: The Future of AI
(首圖為示意圖,來源:Image by macrovector on Freepik)