AI 研究者開發「世界模型」，挑戰大型語言模型框架

隨著 OpenAI、Anthropic 及大型科技公司在開發最先進的大型語言模型上投入數十億美元，有些 AI研究者正致力於下一個重大突破。這些研究者包括史丹佛大學的李飛飛（Fei-Fei Li）和 Meta 的 AI 科學家楊立昆（Yann LeCun），他們正在開發所謂的「世界模型」（World Models）。

與大型語言模型不同，世界模型根據人類對周圍世界的心理構建來預測事件，而不是僅依賴於訓練資料中單詞和短語之間的統計關係。

李飛飛在2024年共同創立了World Labs，並獲得來自Andreessen Horowitz、新企業協會和Radical Ventures等風險投資公司的2.3億美元初始資金。World Labs的目標是將AI模型從2D像素平面提升到完整的3D世界，賦予它們與人類一樣豐富的空間智慧，並更像人類的思考模式。

李飛飛認為，世界模型在創意領域、機器人技術或任何需要無限宇宙的領域都有應用潛力。這可能在軍事應用上帶來進展，幫助戰場上的人員更好地感知周圍環境並預測敵人的下一步行動。

在Meta，楊立昆也有一個小團隊專注於類似的項目。他們使用影片資料來訓練模型，並在不同層次上進行抽象影片的模擬。讓AI不是在像素層面進行預測，而是讓系統能在抽象層面上進行預測，而希望可以透過這個模式去除所有難以預測的細節。

楊立昆和李飛飛都認為，這些模型是創造真正超越人類思維AI的唯一途徑。他們強調，AI系統需要能夠快速學習新任務，理解物理世界，而不僅僅是文本和語言，還要具備一定的常識、推理和規劃能力，以及持久的記憶。

（首圖為示意圖，來源：Image by macrovector on Freepik）