OmniAlign-V – 上海交大联合上海 AI Lab 等推出的高质量数据集

4个月前发布 102 00

OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型（MLLMs）与人类偏好的对齐能力设计的高质量数据集。OmniAlign-V包含约20万个多模态训练样本，涵盖自然图像和信息图表，结合开放式、知识丰富的问答对。OmniAlign-V 的设计注重任务的多样性，包括知识问答...

收录时间：

2025-12-16

打开网站手机查看

OmniAlign-V – 上海交大联合上海 AI Lab 等推出的高质量数据集

OmniAlign-V – 上海交大联合上海 AI Lab 等推出的高质量数据集

OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型（MLLMs）与人类偏好的对齐能力设计的高质量数据集。OmniAlign-V包含约20万个多模态训练样本，涵盖自然图像和信息图表，结合开放式、知识丰富的问答对。OmniAlign-V 的设计注重任务的多样性，包括知识问答、推理任务和创造性任务，基于复杂问题和多样化回答格式提升模型的对齐能力。OmniAlign-V 引入图像筛选策略，确保语义丰富且复杂的图像被用于数据生成。

官网：https://github.com/PhoenixZ810/OmniAlign-V

立即打开官网

数据统计

相关导航

D-DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-DiT（Dual Diffusion Transform...

Fancy123 – 华中科技和华南理工推出的3D网格生成技术

Fancy123是华中科技大学和华南理工大学推出的3D网格生...

StarRocks MCP Server – StarRocks 推出的MCP服务器工具

StarRocks MCP Server 是 StarRoc...

Comet – Perplexity AI 推出的 AI 浏览器

Comet 是 Perplexity AI 推出的 AI 原...

DiffSplat – 北大联合字节推出的 3D 生成框架

DiffSplat是新型的 3D 生成方法，从文本提示和单视...

AI-ClothingTryOn – AI虚拟试穿应用，支持生成多版本试衣效果

AI-ClothingTryOn 是基于 Python 的桌...

MobileLLM – Meta推出的适合移动端的语言模型

MobileLLM是Meta为移动设备用例优化设计的十亿参数...

Pad.ws – 在线AI开发工具，白板功能与代码编辑器深度结合

Pad.ws 是创新的在线开发环境，结合了白板功能与完整的 ...