5 月 14 日,阿里巴巴正式开源通义万相 Wan2.1-VACE,这款视频生成与编辑模型为业界功能最全的工具之一。此次开源的 Wan2.1-VACE 有 1.3B 和 14B 两个版本,前者支持 480P 分辨率,可在消费级显卡运行;后者支持 480P 和 720P 分辨率。它能一站式完成文生视频、图像参考生成等多种任务,拥有强大的可控重绘能力,通过多模态输入机制统一多种输入,支持多任务组合,还提出 VCU 输入范式。其训练采用上下文适配器微调方法,相较 1.3B preview 版本,关键指标显著提升 。
暂无讨论,说说你的看法吧