R1-Omni – 阿里通义开源的全模态大语言模型

1个月前发布 48 00

R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出强大的情感理解能力。在多个情感识别数据集上,R1-Omni 的性能显著优于监督微调(SFT)模型,在分布外场景中表现出色,具有很强的泛化能力。官网:https://github.co...

收录时间:
2025-12-16
R1-Omni – 阿里通义开源的全模态大语言模型R1-Omni – 阿里通义开源的全模态大语言模型

R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出强大的情感理解能力。在多个情感识别数据集上,R1-Omni 的性能显著优于监督微调(SFT)模型,在分布外场景中表现出色,具有很强的泛化能力。

官网:https://github.com/HumanMLLM/R1-Omni


立即打开官网

数据统计

相关导航