WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具
WebWalker是阿里巴巴自然语言处理团队开发的用于评估和...
MAI-DS-R1 是微软基于 DeepSeek R1 改进的AI模型。MAI-DS-R1基于后训练优化,支持响应 99.3% 的敏感话题提示,比原版提升 2 倍,将有害内容风险降低 50%。MAI-DS-R1 在推理能力上保持与 DeepSeek R1 相同的水平,支持多语言回答,适用于国际组织、跨国企业和教育机构等多语言环境。MAI-DS-R1已开源,供研究人员和开发者使用。