MobileVD – 首个针对移动设备优化的视频扩散模型

4个月前发布 137 00

MobileVD（Mobile Video Diffusion）是首个针对移动设备优化的视频扩散模型，Qualcomm AI Research团队开发。模型基于Stable Video Diffusion（SVD）的时空UNet架构，通过降低帧分辨率、引入多尺度时间表示以及采用两种新颖的剪枝方案来减少通道数和时间块数量，显著降低了内存和计...

收录时间：

2025-12-16

打开网站手机查看

MobileVD – 首个针对移动设备优化的视频扩散模型

MobileVD – 首个针对移动设备优化的视频扩散模型

MobileVD（Mobile Video Diffusion）是首个针对移动设备优化的视频扩散模型，Qualcomm AI Research团队开发。模型基于Stable Video Diffusion（SVD）的时空UNet架构，通过降低帧分辨率、引入多尺度时间表示以及采用两种新颖的剪枝方案来减少通道数和时间块数量，显著降低了内存和计算成本。MobileVD基于对抗微调技术，将去噪过程简化为一步完成，进一步提高了模型的效率。

官网：https://arxiv.org/pdf/2412.07583

立即打开官网

数据统计

相关导航

Diffutoon – 阿里推出的AI将视频转卡通风格的框架

Diffutoon是由阿里巴巴和华东师大的研究人员推出的一个...

Matrix-Game – 昆仑万维开源的工业界首个空间智能大模型

Matrix-Game是昆仑万维开源的工业界首个10B+空间...

Light-A-Video – 上海AI Lab联合交大等高校推出的视频重照明方法

Light-A-Video 是上海交通大学、中国科学技术大学...

EchoMimic – 阿里推出的开源数字人项目，赋予静态图像以生动语音和表情

EchoMimic是阿里蚂蚁集团推出的 AI数字人开源项目...

AniPortrait – 腾讯开源的照片对口型视频生成框架

AniPortrait是腾讯开源的照片对口型 AI视频生成...

Tavus – AI视频生成平台，支持数字人克隆和实时对话

Tavus 是先进的个性化 AI视频生成平台，支持创建高度...

Oryx – 腾讯联合清华和南洋理工大学推出的多模态大语言模型

Oryx是由清华大学、腾讯和南洋理工大学联合推出的多模态大型...

MetaHuman-Stream – 实时交互流式AI数字人技术

MetaHuman-Stream 是一项前沿的实时交互流式A...