yujianwandou

帅气的我简直无法用语言描述！

文章9 网址2062 评论0

VQAScore – CMU联合Meta推出的文本到视觉图像生成评估方法

VQAScore是CMU和Meta联合推出的评估方法，基于视...

1350

VPP – 清华和星动纪元推出的首个AIGC机器人大模型

VPP（Video Prediction Policy）是清...

1320

Voyage Multimodal-3 – Voyage AI 推出的多模态嵌入模型

Voyage Multimodal-3 是 Voyage A...

1990

AI表格数据处理

VoxInstruct – 清华推出的开源语音合成技术，支持多语言和跨语言合成

VoxInstruct 是由清华大学开源的语音合成技术，能根...

1230

VoltAgent – 开源的AI Agent构建和编排框架

VoltAgent 是开源的 TypeScript 框架，用...

1250

Voila – 开源端到端语音大模型，实现低延迟语音对话

Voila 是开源的端到端语音大模型，专为语音交互而设计。具...

1230

Void – 开源的AI辅助编程工具，代码自动补全和智能建议

Void 是基于 Visual Studio Code 构建...

1730

VoiceCraft – 开源的语音编辑和文本转语音模型

VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开...

1430

悦录 – AI语音转文字工具，支持多种语言和方言、准确率高达95%+

悦录是 AI语音转文字工具，基于同花顺的智能语音、自然语言...

1310

VoiceCanvas – 开源AI语音合成平台，支持多语言、多音色、声音克隆服务

VoiceCanvas 是开源的多语言语音合成平台。基于...

1100

Voice-Pro – 开源AI音频处理工具，集成转录、翻译、TTS等一站式服务

Voice-Pro是开源的多功能音频处理工具，集成语音转文字...

1410

VMix – 字节联合中科大推出增强模型生成美学质量的适配器

VMix是创新的即插即用美学适配器，提升文本到图像扩散模型生...

1290