阿里發布新開源 AI 模型，可透過影片解讀人類情緒

作者 MoneyDJ | 發布日期 2025 年 03 月 13 日 12:30 | 分類 AI 人工智慧 , 軟體、系統

Loading...

阿里發布新開源 AI 模型，可透過影片解讀人類情緒

綜合中媒報導，阿里巴巴集團旗下通義實驗室 12 日發布新的開源人工智慧模型 R1-Omni，據稱是業界首個結合可驗證獎勵的強化學習（RLVR）的全能多模態大語言模型。

據悉，R1-Omni專注於情感辨識任務，研究人員利用RLVR對開源Omni模型HumanOmni-0.5B進行最佳化，在推理能力、情緒辨識準確度和泛化能力三個關鍵方面顯著提高了其效能。

此外，R1-Omni能透過結合視覺和聽覺訊息，對輸入的影片或音訊內容進行情感辨識，準確判斷其中所表達的情感；而且R1-Omni能生成詳細的情感辨識的推理過程，增強模型的可解性。

（本文由 MoneyDJ新聞授權轉載；首圖來源：Unsplash）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

科技新報粉絲團

訂閱免費電子報

關鍵字: AI , R1-Omni , 阿里巴巴