騰訊混元開源語音數位人模型,助攻影片生成

作者 | 發布日期 2025 年 05 月 28 日 15:15 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
騰訊混元開源語音數位人模型,助攻影片生成

綜合港媒及中媒報導,騰訊旗下大語言模型騰訊混元 28 日發布並開源的語音數位人模型 HunyuanVideo-Avatar。

該模型由騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室 MuseV 技術聯合研發,支援頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向影片創作者提供高一致性、高動態性的影片生成能力。

據了解,用戶可上傳人物圖像與音訊,HunyuanVideo-Avatar模型會自動理解圖片與音訊,例如人物所在環境、音訊所蘊含的情感等,讓圖中人物自然說話或唱歌,生成包含自然表情、唇形同步及全身動作的影片。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:騰訊

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》