R1-Omni – 阿里通义开源的全模态大语言模型

4个月前发布 154 00

R1-Omni 是阿里通义推出的基于强化学习（RLVR）的全模态大语言模型，专注于情感识别任务。通过结合视觉和音频信息，能清晰地解释情感识别的推理过程，展现出强大的情感理解能力。在多个情感识别数据集上，R1-Omni 的性能显著优于监督微调（SFT）模型，在分布外场景中表现出色，具有很强的泛化能力。官网：https://github.co...

收录时间：

2025-12-16

打开网站手机查看

AI音频工具

R1-Omni – 阿里通义开源的全模态大语言模型

打开网站

R1-Omni 是阿里通义推出的基于强化学习（RLVR）的全模态大语言模型，专注于情感识别任务。通过结合视觉和音频信息，能清晰地解释情感识别的推理过程，展现出强大的情感理解能力。在多个情感识别数据集上，R1-Omni 的性能显著优于监督微调（SFT）模型，在分布外场景中表现出色，具有很强的泛化能力。

官网：https://github.com/HumanMLLM/R1-Omni

立即打开官网