阿里巴巴全面開源旗下影片生成模型萬相 2.1

綜合中媒報導，阿里巴巴於 25 日晚間，全面開源旗下影片生成模型萬相 2.1 （Wan2.1）模型。此次開源採用最寬鬆的 Apache 2.0 協議，14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源，同時支援文生影片和圖生影片任務，全球開發者可在 Github、HuggingFace 和魔搭社區下載體驗。

2025年1月，阿里巴巴旗下萬相剛宣布推出2.1版本模型升級，影片生成、圖像生成兩大能力均獲得提升。在影片生成方面，萬相2.1透過自研的高效VAE和DiT架構增強了時空上下文建模能力，支援無限長1080P影片的高效編解碼，首次實現了中文文字影片生成功能，登上VBench榜單第一。

（Source：阿里巴巴）

據了解，14B萬相模型在指令遵循、複雜運動生成、物理建模、文字影片生成等方面表現突出，在評測集VBench中，萬相2.1以總分86.22%的成績超越Sora、Luma、Pika等中國國內外模型，位列榜首；1.3B版本測試結果不僅超過了更大尺寸的開源模型，甚至還接近部分閉源模型，同時能在消費級顯卡運行，號稱「僅需8.2GB視訊記憶體就可生成480P影片」，適用於二次模型開發及學術研究。