MoCha – Meta 联合滑铁卢大学推出的端到端对话角色视频生成模型

4个月前发布 208 00

MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端对话角色视频生成模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。MoCha 采用语音-视频窗口注意力机制，解决了视频压缩时音频分辨率不匹配以及唇部动作错位的问题。支持多角色轮换对话，能生成具有情感表达和全身动作的角色动画。官网：https://arxiv...

收录时间：

2025-12-16

打开网站手机查看

AI视频工具

MoCha – Meta 联合滑铁卢大学推出的端到端对话角色视频生成模型

打开网站

MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端对话角色视频生成模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。MoCha 采用语音-视频窗口注意力机制，解决了视频压缩时音频分辨率不匹配以及唇部动作错位的问题。支持多角色轮换对话，能生成具有情感表达和全身动作的角色动画。

官网：https://arxiv.org/pdf/2503.23307

立即打开官网