LanDiff – 浙大联合月之暗面推出的文本到视频生成混合框架

4个月前发布 111 00

LanDiff是用于高质量的文本到视频（T2V）生成的创新混合框架，结合了自回归语言模型（LLM）和扩散模型（Diffusion Model）的优势，通过粗到细的生成方式，有效克服了单一方法在语义理解和视觉质量上的局限性。在VBench T2V基准测试中取得了85.43的高分，超越了包括13B的Hunyuan Video在内的多个开源...

收录时间：

2025-12-16

打开网站手机查看

LanDiff – 浙大联合月之暗面推出的文本到视频生成混合框架

LanDiff – 浙大联合月之暗面推出的文本到视频生成混合框架

LanDiff是用于高质量的文本到视频（T2V）生成的创新混合框架，结合了自回归语言模型（LLM）和扩散模型（Diffusion Model）的优势，通过粗到细的生成方式，有效克服了单一方法在语义理解和视觉质量上的局限性。在VBench T2V基准测试中取得了85.43的高分，超越了包括13B的Hunyuan Video在内的多个开源和商业模型。

官网：https://arxiv.org/pdf/2503.04606

立即打开官网

数据统计

相关导航

ReCamMaster – 浙大联合快手等推出的视频重渲染框架

ReCamMaster 是浙江大学、快手科技等联合推出的视频...

AnimateAnything – 浙江大学联合北航推出的统一可控视频生成技术

AnimateAnything是浙江大学和北京航空航天大学研...

DynamicFace – 小红书联合上海交大等推出的视频换脸技术

DynamicFace是小红书团队推出新型的视频换脸技术...

Cosmos – 英伟达推出的生成式世界基础模型平台

Cosmos是英伟达推出的生成式世界基础模型平台，加速物理人...

AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统

AnimeGamer 是腾讯 PCG 和香港城市大学共同推出...

VideoReward – 港中文、清华、快手等联合推出的视频生成偏好数据集及奖励模型

VideoReward 是香港中文大学、清华大学、快手科技等...

Video-T1 – 清华联合腾讯推出的视频生成技术

Video-T1 是清华大学和腾讯的研究人员共同推出的视频...

剪小映 – 抖音推出的AI视频剪辑应用

剪小映是抖音推出的 AI视频剪辑应用，专为零基础用户设计...