
綜合中媒報導,阿里巴巴集團旗下通義實驗室 12 日發布新的開源人工智慧模型 R1-Omni,據稱是業界首個結合可驗證獎勵的強化學習(RLVR)的全能多模態大語言模型。
據悉,R1-Omni專注於情感辨識任務,研究人員利用RLVR對開源Omni模型HumanOmni-0.5B進行最佳化,在推理能力、情緒辨識準確度和泛化能力三個關鍵方面顯著提高了其效能。
此外,R1-Omni能透過結合視覺和聽覺訊息,對輸入的影片或音訊內容進行情感辨識,準確判斷其中所表達的情感;而且R1-Omni能生成詳細的情感辨識的推理過程,增強模型的可解性。