DreamActor-M1 – 字节跳动推出的 AI 图像动画框架
DreamActor-M1是字节跳动推出的先进AI图像动画框...
LLaVA-OneVision是字节跳动推出开源的多模态AI模型,LLaVA-OneVision通过整合数据、模型和视觉表示的见解,能同时处理单图像、多图像和视频场景下的计算机视觉任务。LLaVA-OneVision支持跨模态/场景的迁移学习,特别在图像到视频的任务转移中表现出色,具有强大的视频理解和跨场景能力。
官网:https://llava-vl.github.io/blog/2024-08-05-llava-onevision/