騰訊混元開源語音數位人模型，助攻影片生成

作者 MoneyDJ | 發布日期 2025 年 05 月 28 日 15:15 | 分類 AI 人工智慧 , 軟體、系統

Loading...

綜合港媒及中媒報導，騰訊旗下大語言模型騰訊混元 28 日發布並開源的語音數位人模型 HunyuanVideo-Avatar。

該模型由騰訊混元視頻大模型（HunyuanVideo）及騰訊音樂天琴實驗室 MuseV 技術聯合研發，支援頭肩、半身與全身景別，以及多風格、多物種與雙人場景，面向影片創作者提供高一致性、高動態性的影片生成能力。

據了解，用戶可上傳人物圖像與音訊，HunyuanVideo-Avatar模型會自動理解圖片與音訊，例如人物所在環境、音訊所蘊含的情感等，讓圖中人物自然說話或唱歌，生成包含自然表情、唇形同步及全身動作的影片。

（本文由 MoneyDJ新聞授權轉載；首圖來源：騰訊）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

科技新報粉絲團

訂閱免費電子報

關鍵字: AI , 混元大模型 , 騰訊