InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

1个月前发布 35 00

InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展,特别是在长 视频处理 和细粒度时空感知方面表现出色。模型能处理长达万帧的视频,视频处理长度较前代提升了6倍,可在长视频中精准定位目标帧,实现“大海捞针”式的检索。支持通用视频问答,完成目标跟踪、分...

收录时间:
2025-12-16
InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展,特别是在长 视频处理 和细粒度时空感知方面表现出色。模型能处理长达万帧的视频,视频处理长度较前代提升了6倍,可在长视频中精准定位目标帧,实现“大海捞针”式的检索。支持通用视频问答,完成目标跟踪、分割等专业视觉任务。

官网:https://github.com/OpenGVLab/InternVideo/tree/main/InternVideo2.5


立即打开官网

数据统计

相关导航