yujianwandou

帅气的我简直无法用语言描述！

文章9 网址2062 评论0

VMB – 中科院联合多所高校机构推出增强多模态音乐生成的框架

VMB（Visuals Music Bridge）是中国科学...

1300

VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1 是 Om AI Lab 推出的基于强化学习技术...

1860

VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型

VITRON是Skywork AI、新加坡国立大学和南洋理工...

1150

ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose 是基于 Transformer 架构的人体姿...

1390

VITA-Audio – 开源的端到端多模态语音大模型，低延迟、推理快

VITA-Audio 是开源的端到端多模态语音大模型，具有低...

1430

VisoMaster – AI换脸和编辑软件，支持图片和视频高质量换脸

VisoMaster 是基于 AI 技术的换脸和编辑软件...

1320

VisionFM – 通用眼科AI大模型，具备少样本多种疾病诊断能力

VisionFM（伏羲慧眼）是多模态多任务的视觉基础模型，专...

1260

VISION XL – AI视频修复处理工具，修复缺失、支持四倍超分辨率

VISION XL是高效的视频修复和超分辨率工具，基于潜在扩...

1290

Vision Search Assistant – 结合视觉语言模型和网络代理搜索技术的开源框架

Vision Search Assistant（VSA）是结...

1620

Vision Parse – 开源的 PDF 转 Markdown 工具

Vision Parse是开源的PDF文档转换工具，基于视觉...

1850

AI表格数据处理

VirtualWife – AI虚拟数字人项目，可在B站进行直播

VirtualWife是一个创新的虚拟数字人项目，专注于开发...

1850

VirSci – 上海人工智能实验室推出的多智能体AI科学研究工具

VirSci（Virtual Scientists）是上海人...

1160