LeviTor – 南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术

4个月前发布 124 00

LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术，结合深度信息和K-means聚类点控制视频中3D物体的轨迹，无需显式的3D轨迹跟踪。LeviTor用高质量的视频对象分割数据集进行训练，有效捕捉复杂场景中的物体运动和交互，基于用户友好的推理流程简化3D轨迹输入，让视频生成技术更加先进和易用。LeviTor的引入为...

收录时间：

2025-12-16

打开网站手机查看

LeviTor – 南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术

LeviTor – 南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术

LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术，结合深度信息和K-means聚类点控制视频中3D物体的轨迹，无需显式的3D轨迹跟踪。LeviTor用高质量的视频对象分割数据集进行训练，有效捕捉复杂场景中的物体运动和交互，基于用户友好的推理流程简化3D轨迹输入，让视频生成技术更加先进和易用。LeviTor的引入为3D物体轨迹控制铺平道路，拓宽创意应用范围，适用于更广泛的用户群体。

官网：https://github.com/qiuyu96/LeviTor

立即打开官网

数据统计

相关导航

Oasis – Decart联合Etched推出首款AI实时生成的游戏系统

Oasis是世界上首款AI实时生成的游戏，由Decart和E...

千音漫语 – AI声音创作助手，涵盖多种语言和音色

千音漫语是北京熠声科技推出的智能声音创作助手，为用户提供高效...

Eagle 2.5 – 英伟达推出的视觉语言模型

Eagle 2.5是英伟达推出的视觉语言模型，专注于长上下文...

StoryTeller – 字节、上海交大、北大共同推出的全自动长视频描述生成一致系统

StoryTeller是字节跳动、上海交通大学和北京大学共同...

MotionCtrl – 腾讯等推出的视频生成模型的运动控制器

MotionCtrl是由来自腾讯、香港大学、上海AI实验室...

video-subtitle-master – 开源AI字幕生成工具，支持批量为视频或音频生成字幕

video-subtitle-master 是能批量为视频或...

UniEdit – 免训练调优的统一视频编辑框架

UniEdit是由浙江大学、微软研究院和北京大学的研究人员推...

FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking 是阿里巴巴 AMAP 团队和北...