FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架

1个月前发布 31 00

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持 视频生成 (IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Diffusion Transformers),引入3D面部几何先验知识,确保视频合成中面部结构的稳定性和合理性。FantasyID基于多视角人脸增强策略,避免模型简...

收录时间:
2025-12-16
FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持 视频生成 (IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Diffusion Transformers),引入3D面部几何先验知识,确保视频合成中面部结构的稳定性和合理性。FantasyID基于多视角人脸增强策略,避免模型简单复制参考人脸,增加面部表情和头部姿态的动态性。FantasyID基于可学习的分层感知注入机制,将融合的2D和3D特征有选择地注入到扩散模型的每一层,平衡身份保留和动作动态性。

官网:https://github.com/Fantasy-AMAP/fantasy-id


立即打开官网

数据统计

相关导航