yujianwandou

帅气的我简直无法用语言描述!
VMB – 中科院联合多所高校机构推出增强多模态音乐生成的框架

VMB – 中科院联合多所高校机构推出增强多模态音乐生成的框架

VMB(Visuals Music Bridge)是中国科学...
330
VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1 是 Om AI Lab 推出的基于强化学习技术...
660
VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型

VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型

VITRON是Skywork AI、新加坡国立大学和南洋理工...
300
ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose 是基于 Transformer 架构的人体姿...
340
VITA-Audio – 开源的端到端多模态语音大模型,低延迟、推理快

VITA-Audio – 开源的端到端多模态语音大模型,低延迟、推理快

VITA-Audio 是开源的端到端多模态语音大模型,具有低...
410
VisoMaster – AI换脸和编辑软件,支持图片和视频高质量换脸

VisoMaster – AI换脸和编辑软件,支持图片和视频高质量换脸

VisoMaster 是基于 AI 技术的 换脸 和编辑软件...
340
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力

VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力

VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专...
470
VISION XL – AI视频修复处理工具,修复缺失、支持四倍超分辨率

VISION XL – AI视频修复处理工具,修复缺失、支持四倍超分辨率

VISION XL是高效的视频修复和超分辨率工具,基于潜在扩...
310
Vision Search Assistant – 结合视觉语言模型和网络代理搜索技术的开源框架

Vision Search Assistant – 结合视觉语言模型和网络代理搜索技术的开源框架

Vision Search Assistant(VSA)是结...
460
Vision Parse – 开源的 PDF 转 Markdown 工具

Vision Parse – 开源的 PDF 转 Markdown 工具

Vision Parse是开源的PDF文档转换工具,基于视觉...
610
VirtualWife – AI虚拟数字人项目,可在B站进行直播

VirtualWife – AI虚拟数字人项目,可在B站进行直播

VirtualWife是一个创新的虚拟数字人项目,专注于开发...
660
VirSci – 上海人工智能实验室推出的多智能体AI科学研究工具

VirSci – 上海人工智能实验室推出的多智能体AI科学研究工具

VirSci(Virtual Scientists)是上海人...
300