次级导航
blog
关于
收录投稿
二级菜单样式
获取主题
排行榜
收录投稿
blog
关于
收录投稿
二级菜单样式
获取主题
排行榜
收录投稿
AI语音助手
共 147 篇网址
AI写作工具
AI图像工具
AI视频工具
AI办公工具
AI音频工具
AI搜索工具
AI学习平台
AI工具
AI语音助手
AI图像处理
AI智能体
AI图像生成
AI翻译工具
排序
发布
更新
浏览
点赞
Step-Audio – 阶跃星辰开源的语音交互模型
Step-Audio是阶跃星辰团队推出的首个产品级的开源语音...
29
0
AI语音助手
Step-Audio-TTS-3B – 高性能 TTS 模型,能生成特定情感和说唱风格的语音
Step-Audio-TTS-3B 是 Stepfun-AI...
50
0
AI语音助手
Spirit LM – Meta推出多模态语言模型,无缝集成语音和文本
Spirit LM是由Meta AI团队推出的一种多模态语言...
35
0
AI语音助手
SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型
SpeechGPT 2.0-preview 是复旦大学 Op...
23
0
AI语音助手
Speech-02 – MiniMax 推出的新一代文本转语音模型
Speech-02 是 MiniMax 推出的新一代 文本到...
29
0
AI语音助手
Spark-TTS – AI文本转语音工具,支持中英零样本语音克隆
Spark-TTS 是SparkAudio 团队开源的基于大...
44
0
AI语音助手
Soundwave – 港中文深圳开源的语音理解大模型
Soundwave是香港中文大学(深圳)开源的语音理解大模型...
31
0
AI语音助手
SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统
SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大...
30
0
AI语音助手
SeniorTalk – 智源联合南开开源的超高龄老年人中文对话语音数据集
SeniorTalk 是智源研究院联合南开大学计算机学院人类...
27
0
AI语音助手
Seed-VC – 零样本实现声音克隆和转换的技术
Seed-VC 是一种零样本声音转换技术,基于上下文学习实现...
28
0
AI语音助手
SafeEar – 浙大和清华联合开源的AI音频伪造检测框架
SafeEar是由浙江大学和清华大学联合开发的AI音频伪造检...
48
0
AI语音助手
RTranslator – 开源的离线、实时、多语言翻译应用程序
RTranslator 是一款开源、免费、离线实时翻译应用程...
35
0
AI语音助手
Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型
Reverb ASR是Rev公司推出的开源自动语音识别和说话...
26
0
AI语音助手
RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束
RealtimeSTT是开源的实时 语音转文本 库,专为低延...
46
0
AI语音助手
Realtime API – OpenAI推出的实时语音交互API
Realtime API是OpenAI推出的一种低延迟、多模...
40
0
AI语音助手
PodAgent – 港中文、微软、小红书联合推出的播客生成框架
PodAgent 是香港中文大学、微软和小红书联合推出的播客...
33
0
AI语音助手
Pipecat – 构建语音和多模态对话代理的开源框架
Pipecat是开源的Python框架,专注于构建语音和多模...
29
0
AI语音助手
Phi-4-Multimodal – 微软最新推出的多模态语言模型
Phi-4-Multimodal 是微软最新推出的多模态语言...
36
0
AI语音助手
PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具
PDF to Podcast是NVIDIA推出的PDF转音频...
26
0
AI语音助手
Parler-TTS – Hugging Face开源的文本转语音模型
Parler-TTS是由Hugging Face推出的一款开...
39
0
AI语音助手
Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
Parakeet TDT 0.6B 是英伟达推出的开源自动 ...
32
0
AI语音助手
PaddleSpeech – 百度飞桨团队开源的语音处理工具
PaddleSpeech 是百度飞桨团队开源的语音处理工具...
24
0
AI语音助手
OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音
OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建...
37
0
AI语音助手
OSUM – 西北工业大学开源的语音理解模型
OSUM(Open Speech Understanding...
36
0
AI语音助手
Orpheus TTS – 开源AI语音合成系统,支持多种语音风格
Orpheus TTS 是基于 Llama-3b 架构的开源...
49
0
AI语音助手
OpenVoice – 免费开源的AI语音克隆项目
OpenVoice是由MyShell推出的一个免费开源的AI...
34
0
AI语音助手
Voice Engine – OpenAI公布的AI语音合成和声音克隆模型
Voice Engine是OpenAI最新公布的一项AI语音...
43
0
AI语音助手
GPT-4o – OpenAI最新发布的多模态AI大模型
GPT-4o是OpenAI最新推出的一款先进的人工智能模型...
43
0
AI语音助手
Open-LLM-VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知
Open-LLM-VTuber 是开源的跨平台语音交互 AI...
30
0
AI语音助手
OmniAudio-2.6B – Nexa AI推出的端侧多模态音频语言模型
OmniAudio-2.6B是Nexa AI推出的音频语言模...
38
0
AI语音助手
加载更多
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈