阿里發布新開源 AI 模型,可透過影片解讀人類情緒

作者 | 發布日期 2025 年 03 月 13 日 12:30 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
阿里發布新開源 AI 模型,可透過影片解讀人類情緒

綜合中媒報導,阿里巴巴集團旗下通義實驗室 12 日發布新的開源人工智慧模型 R1-Omni,據稱是業界首個結合可驗證獎勵的強化學習(RLVR)的全能多模態大語言模型。

據悉,R1-Omni專注於情感辨識任務,研究人員利用RLVR對開源Omni模型HumanOmni-0.5B進行最佳化,在推理能力、情緒辨識準確度和泛化能力三個關鍵方面顯著提高了其效能。

此外,R1-Omni能透過結合視覺和聽覺訊息,對輸入的影片或音訊內容進行情感辨識,準確判斷其中所表達的情感;而且R1-Omni能生成詳細的情感辨識的推理過程,增強模型的可解性。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:Unsplash

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》