DiTCtrl – 港中文联合腾讯等机构推出的多提示视频生成方法
DiTCtrl是基于多模态扩散变换器(MM-DiT)架构的多...
FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量帧,保持较低的计算复杂度。FramePack 仅需 6GB 显存在普通笔记本电脑上运行,支持实时生成高清视频,基于抗漂移采样技术保证视频稳定性和连贯性。FramePack提供灵活的调度策略,适用于多种应用场景,降低 AI 视频生成的硬件门槛,推动视频生成技术的平民化。