WAN2.1 是一套全面开放的视频生成模型,它突破了视频生成的界限。1.3B型号仅需要8.19 GB VRAM,使其与几乎所有消费级GPU兼容。它可以在大约4分钟内在RTX 4090上生成5秒的480p视频(无需量化等优化技术)。它的性能甚至可以与某些封闭式模型相媲美。
在 SOTA性能方面,始终优于多个基准测试的现有开源模型,并且可以和最先进的闭源商业模型相媲美!
文章目录
Wan 2.1 视频生成模型本地部署
文字转视频
1、下载 ComfyUI 一键安装包 :【点击前往 】,支持 Windows 和 mac 系统
备用下载地址:
github项目地址:https://github.com/comfyanonymous/ComfyUI
网盘地址A:https://www.123865.com/s/sDt1jv-nR9Y3 提取码:hso4
网盘地址B: https://www.123684.com/s/sDt1jv-nR9Y3 提取码:hso4
2、下载文本编码器和 VAE :
umt5_xxl_fp8_e4m3fn_scaled.safetensors 文件存放位置:ComfyUI/models/text_encoders/
umt5_xxl_fp8_e4m3fn_scaled.safetensors 备用下载地址A:https://www.123865.com/s/sDt1jv-sR9Y3 提取码:md5E
umt5_xxl_fp8_e4m3fn_scaled.safetensors 备用下载地址B:https://www.123684.com/s/sDt1jv-sR9Y3 提取码:md5E
wan_2.1_vae.safetensors 文件存放位置:ComfyUI/models/vae/
wan_2.1_vae.safetensors 备用下载A: https://www.123865.com/s/sDt1jv-WR9Y3 提取码:gc1I
wan_2.1_vae.safetensors 备用下载B: https://www.123684.com/s/sDt1jv-WR9Y3 提取码:gc1I
3、下载视频生成模型 【点击下载】
备用下载地址A: https://www.123865.com/s/sDt1jv-NR9Y3 提取码:zBH6
备用下载地址B: https://www.123684.com/s/sDt1jv-NR9Y3 提取码:zBH6
注意:建议使用 fp16 版本而不是 bf16 版本,因为它们会产生更好的结果。
质量等级(从高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn
这些文件存放位置:ComfyUI/models/diffusion_models/
这些示例使用 16 位文件,但如果内存不足,则可以使用 fp8 文件。
4、文字转视频工作流:下载 Json格式的工作流文件
备用下载地址A: https://www.123865.com/s/sDt1jv-OR9Y3 提取码:kxWS
备用下载地址B: https://www.123684.com/s/sDt1jv-OR9Y3 提取码:kxWS
进阶篇: 图像转视频
此工作流程需要:
(1)wan2.1_i2v_480p_14B_fp16.safetensors文件(将其放入:ComfyUI/models/diffusion_models/)
备用下载地址A: https://www.123865.com/s/sDt1jv-RR9Y3 提取码:1hPz
备用下载地址B: https://www.123684.com/s/sDt1jv-RR9Y3 提取码:1hPz
(2)clip_vision_h.safetensors (将其放入:ComfyUI/models/clip_vision/)
备用下载地址A: https://www.123865.com/s/sDt1jv-DR9Y3 提取码:nMmH
备用下载地址B: https://www.123684.com/s/sDt1jv-DR9Y3 提取码:nMmH
请注意,此示例仅生成 512×512 的 33 帧,因为我希望它易于访问,但模型可以做的不止这些。如果您有硬件/耐心运行它,720p 模型就相当不错。
输入图像可以在通量页面上找到。
以下是720p 型号的相同示例:
评论