LongLLaVA – 香港中文大学推出的多模态上下文混合架构大语言模型
LongLLaVA是的多模态大型语言模型(MLLM),是香港...
Open-Sora 2.0 是潞晨科技推出的全新开源SOTA(State-of-the-Art) 视频生成 模型。Open-Sora 2.0 用 20 万美元(224 张 GPU)成功训练出 11B 参数的商业级模型,相比传统高性能视频生成模型大幅降低了训练成本。模型在 VBench 和用户偏好测试中表现卓越,性能媲美甚至超越 HunyuanVideo 和 30B 参数的 Step-Video 等主流闭源模型。Open-Sora 2.0 基于 3D 自编码器、3D 全注意力机制和 MMDiT 架构,结合高效的并行训练方案和高压缩比自编码器,显著提升训练效率和推理速度。