yujianwandou

帅气的我简直无法用语言描述!
VQAScore – CMU联合Meta推出的文本到视觉图像生成评估方法

VQAScore – CMU联合Meta推出的文本到视觉图像生成评估方法

VQAScore是CMU和Meta联合推出的评估方法,基于视...
440
VPP – 清华和星动纪元推出的首个AIGC机器人大模型

VPP – 清华和星动纪元推出的首个AIGC机器人大模型

VPP(Video Prediction Policy)是清...
300
Voyage Multimodal-3 – Voyage AI 推出的多模态嵌入模型

Voyage Multimodal-3 – Voyage AI 推出的多模态嵌入模型

Voyage Multimodal-3 是 Voyage A...
580
VoxInstruct – 清华推出的开源语音合成技术,支持多语言和跨语言合成

VoxInstruct – 清华推出的开源语音合成技术,支持多语言和跨语言合成

VoxInstruct 是由清华大学开源的语音合成技术,能根...
330
VoltAgent – 开源的AI Agent构建和编排框架

VoltAgent – 开源的AI Agent构建和编排框架

VoltAgent 是开源的 TypeScript 框架,用...
410
Voila – 开源端到端语音大模型,实现低延迟语音对话

Voila – 开源端到端语音大模型,实现低延迟语音对话

Voila 是开源的端到端语音大模型,专为语音交互而设计。具...
420
Void – 开源的AI辅助编程工具,代码自动补全和智能建议

Void – 开源的AI辅助编程工具,代码自动补全和智能建议

Void 是基于 Visual Studio Code 构建...
550
VoiceCraft – 开源的语音编辑和文本转语音模型

VoiceCraft – 开源的语音编辑和文本转语音模型

VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开...
480
悦录 – AI语音转文字工具,支持多种语言和方言、准确率高达95%+

悦录 – AI语音转文字工具,支持多种语言和方言、准确率高达95%+

悦录是 AI语音转文字工具 ,基于同花顺的智能语音、自然语言...
420
VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务

VoiceCanvas – 开源AI语音合成平台,支持多语言、多音色、声音克隆服务

VoiceCanvas 是开源的多语言 语音合成 平台。基于...
300
Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务

Voice-Pro – 开源AI音频处理工具,集成转录、翻译、TTS等一站式服务

Voice-Pro是开源的多功能音频处理工具,集成语音转文字...
380
VMix – 字节联合中科大推出增强模型生成美学质量的适配器

VMix – 字节联合中科大推出增强模型生成美学质量的适配器

VMix是创新的即插即用美学适配器,提升文本到图像扩散模型生...
420