Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

4个月前发布 108 00

Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究人员共同提出的一个 AI对口型肖像图像动画技术，可基于语音音频输入来驱动生成逼真且动态的肖像图像视频。该框架采用了基于扩散的生成模型和分层音频驱动视觉合成模块，提高了音频与视觉输出之间的同步精度。Hallo的网络架构整合了UNet去噪器、时间对齐技术和参考网络，以增强动...

收录时间：

2025-12-16

打开网站手机查看

Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

Hallo – 复旦百度等开源的AI对口型肖像视频生成框架

Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究人员共同提出的一个 AI对口型肖像图像动画技术，可基于语音音频输入来驱动生成逼真且动态的肖像图像视频。该框架采用了基于扩散的生成模型和分层音频驱动视觉合成模块，提高了音频与视觉输出之间的同步精度。Hallo的网络架构整合了UNet去噪器、时间对齐技术和参考网络，以增强动画的质量和真实感，不仅提升了图像和视频的质量，还显著增强了唇动同步的精度，并增加了动作的多样性。

官网：https://fudan-generative-vision.github.io/hallo/#/

立即打开官网

数据统计

相关导航

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

ACTalker 是用于生成逼真说话人头部视频的端到端视频扩...

MTVCrafter – 中科院联合中国电信等机构推出的人像动画生成框架

MTVCrafter是中国科学院深圳先进技术研究院计算机视觉...

BiliNote – 开源 AI 视频笔记工具，自动提取视频内容生成Markdown格式

BiliNote 是开源的 AI 视频笔记助手，支持基于哔哩...

Loong – 港大和字节联合推出的长视频生成模型

Loong是由香港大学和字节跳动联合推出的一种新型长视频生成...

LobeChat – 开源的AI聊天框架，零代码部署个人AI助手

LobeChat是开源AI聊天框架，支持与多个AI供应商的集...

Enhance-A-Video – 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

Enhance-A-Video 是新加坡国立大学、上海人工智...

LVCD – 腾讯联合香港城市大学推出为动漫视频线稿上色的AI框架

LVCD（Large Video Color Diffusi...

EchoMimic – 阿里推出的开源数字人项目，赋予静态图像以生动语音和表情

EchoMimic是阿里蚂蚁集团推出的 AI数字人开源项目...