Pippo – Meta 推出的单图生成多视角高清人像视频模型

4个月前发布 100 00

Pippo是Meta Reality Labs推出的图像到视频生成模型，能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器，预训练了30亿张人像图像，在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块，用于注入像素对齐的条件，以及注意力偏差技术，能在推理时生成比训练时多5...

收录时间：

2025-12-16

打开网站手机查看

Pippo – Meta 推出的单图生成多视角高清人像视频模型

Pippo – Meta 推出的单图生成多视角高清人像视频模型

Pippo是Meta Reality Labs推出的图像到视频生成模型，能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器，预训练了30亿张人像图像，在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块，用于注入像素对齐的条件，以及注意力偏差技术，能在推理时生成比训练时多5倍以上的视角。Pippo引入了重投影误差，用于评估多视角生成的3D一致性。

官网：https://github.com/facebookresearch/pippo

立即打开官网

数据统计

相关导航

Valley – 字节跳动推出的多模态大模型

Valley是字节跳动推出的多模态大模型，用于处理涉及文本...

MetaHuman-Stream – 实时交互流式AI数字人技术

MetaHuman-Stream 是一项前沿的实时交互流式A...

浦语灵笔 – 开源的多模态大模型，性能媲美GPT-4V

浦语灵笔IXC-2.5是上海人工智能实验室推出的新一代多模态...

DAM-3B – 英伟达推出的多模态大语言模型

DAM-3B（Describe Anything 3B）是英...

SUAPP AI – 为建筑设计行业打造的AI设计渲染工具

SUAPP AI（灵感AI）是为建筑设计行业打造的 AI 工...

SmoothCache – Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Trans...

点点 – 小红书推出的 AI 搜索助手，主打生活场景

点点是小红书推出的 AI搜索助手，主打生活服务场景的聚合搜...

AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压...