中國 AI 新創公司 DeepSeek 近期因推出先進的大語言模型而引發全球關注,而開發團隊核心成員之一、年輕天才羅福莉更再次成為了熱門話題。這位被譽為「AI 天才少女」的 95 後,憑藉其在人工智慧領域的突出表現,迅速成為焦點人物。去年她就吸引了小米創始人雷軍親自挖角,提供千萬人民幣年薪邀請她來帶領小米 AI 大模型團隊。
羅福莉的成名之路起源於北京大學的碩士研究。2019 年,當她仍在學期間,便在人工智慧領域的頂級國際會議 ACL 上發表了 8 篇論文,迅速引起業界關注。此後,她加入阿里巴巴的達摩院,負責開發多語言預訓練模型 VECO,並為 AliceMind 開源專案貢獻了大量力量。
在 2022 年,羅福莉轉戰量化金融領域,加入「幻方量化」,從事深度學習與策略建模研究。隨後,她再度跳槽至 AI 新創公司 DeepSeek,擔任深度學習研究員,並參與開發了 MoE 大模型 DeepSeek-V2。DeepSeek 這家公司的快速崛起,甚至引發了矽谷業界的關注,其推出的 DeepSeek-V3 模型被譽為「AI 界的拼多多」,因為其訓練成本極低,並且開源推廣。
羅福莉的專業能力和影響力讓她迅速成為業界熱點,甚至有多家出版商和經紀公司向她伸出橄欖枝。2023 年,她被小米重金挖角,接手領導小米的 AI 大模型團隊,並參與公司的人工智慧戰略布局。據悉,這次挖角是小米在 AI 領域強化實力的一部分,並計劃加大研發投入,預計 2025 年小米的研發費用將達 300 億人民幣。
小米在 AI 領域的布局也在加速,2023 年 4 月,小米成立了專門的 AI 實驗室,並組建了大模型團隊。為了支援 AI 領域的發展,小米還在同年 11 月成立了 AI 平台部,並大力招募相關人才。小米集團總裁盧偉冰表示,未來五年內,小米在 AI、作業系統及晶片等底層技術的研發投入將超過 1,000 億人民幣。
雷軍看中羅福莉的深度學習專業背景,尤其是她在 DeepSeek 的貢獻,這也符合小米在平衡大模型業務成本與效益方面的需求。隨著羅福莉的加入,小米的 AI 團隊或將迎來新一輪的技術突破和創新。