万相2.2（Wan2.2）完整教程：阿里通义实验室最强开源视频模型

本篇指南全面拆解由阿里通义实验室推出的最新一代开源视频生成模型 Wan2.2。无论你是专业动态设计师还是 AI 视频爱好者，把 Wan2.2 接入 ComfyUI 后，都能实现电影级 AI 视频的精细化控制。

一、Wan2.2 是什么？架构上的一次革命

Wan2.2 于 2026 年初发布，不只是 Wan2.1 的小版本迭代，而是首次在视频扩散模型中引入了 MoE（混合专家）架构。

MoE 混合专家架构 传统大模型是“稠密型”，每次计算都会激活全部参数； Wan2.2 采用双专家机制：
- 高噪声专家：负责初期画面构图与运动规划
- 低噪声专家：负责后期精细纹理与细节渲染
高效能设计 模型总参数量 27B，但实时激活仅 14B，用小得多的显存占用，跑出顶级画质。
电影级美学 训练数据量比上一代多 80% 以上，专门针对光影、对比度、专业运镜做了标注，成片更像实拍影视。
原生高分辨率 支持直接生成 720p、1280p 分辨率，24fps 流畅视频。

根据你的显卡配置选择即可：

模型	激活参数量	建议显存	适用场景
Wan2.2-T2V-A14B	14B	24GB 以上（RTX 3090/4090）	高端电影级文生视频
Wan2.2-I2V-A14B	14B	24GB 以上	专业图生视频，时序一致性极强
Wan2.2-TI2V-5B	5B	10GB–12GB	消费级显卡快速迭代测试

运行 Wan2.2 需要最新版 ComfyUI + 专属自定义节点。

打开 ComfyUI Manager，搜索安装：

主扩散模型：放到 ComfyUI/models/checkpoints/ （部分节点版本也可放在 models/diffusion_models/）
VAE：放到 ComfyUI/models/vae/ 必须用 Wan2.2 专用 VAE，才能正确支持 16×16×4 压缩格式
文本编码器：一般需要 T5-v1.1-xxl 和 UMT5，放到 models/clip/

从零生成视频，需要规范的提示词 + 合理采样参数。

WanVideo Loader：选择 Wan2.2-T2V-14B 模型
Empty Wan Latent：设置分辨率与帧数
- 14B 模型推荐：1280×720
- 帧数：81 帧（24fps 下约 5 秒）
CLIP Text Encode：Wan2.2 更懂自然语句，别堆关键词优质提示词示例：
暴雨中的赛博朋克都市，电影级跟拍镜头，霓虹灯光倒映在水洼中，超写实，8K，高对比度
高级 KSampler 设置
- 步数：30–50
- CFG：5.0–7.0（Wan2.2 对 CFG 敏感，别设太高）
- 采样器：uni_pc 或 euler
- 调度器：simple

Wan2.2 的图生视频是 2026 年公认的“行业标杆”，能让 AI 静图动起来，且时序一致性极强。

如果生成速度太慢，可以加载 Lightx2v V2 蒸馏 LoRA，能把采样步数从 40 步直接降到 8–12 步，画质几乎不下降，对 RTX 3080、4070 这类单显卡用户极其友好。

Wan2.2 让高端视频生成真正走向普及。借助 MoE 架构 + ComfyUI 可视化工作流，你可以做出媲美商业闭源工具的电影级短片，无论是个人创作还是商用项目都完全够用。