只需 3 秒音訊，微軟新 AI 模型就能模仿某人聲音念稿

作者 Evan | 發布日期 2023 年 01 月 12 日 7:45 | 分類 AI 人工智慧 , Microsoft , 會員專區

很多人見識過有心人用 Deepfake 技術合成超逼真假影片的能耐，如今 AI 深度學習技術又進一步模擬特定人物聲音展現強大威力。5 日微軟研究人員宣布推出 VALL-E 全新文字轉語音（Text-to-Speech）AI 人工智慧模型，只要餵給它某人 3 秒鐘音訊，模型就能模擬出聲音、語調及情緒講出任何話。