次级导航
blog
关于
收录投稿
二级菜单样式
获取主题
排行榜
收录投稿
blog
关于
收录投稿
二级菜单样式
获取主题
排行榜
收录投稿
AI语音助手
共 147 篇网址
AI写作工具
AI图像工具
AI视频工具
AI办公工具
AI音频工具
AI搜索工具
AI学习平台
AI工具
AI语音助手
AI图像处理
AI智能体
AI图像生成
AI翻译工具
排序
发布
更新
浏览
点赞
Open-LLM-VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知
Open-LLM-VTuber 是开源的跨平台语音交互 AI...
136
0
AI语音助手
3D-Speaker – 阿里通义推出的多模态说话人识别任务开源项目
3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态...
136
0
AI语音助手
Phi-4-Multimodal – 微软最新推出的多模态语言模型
Phi-4-Multimodal 是微软最新推出的多模态语言...
135
0
AI语音助手
Open NotebookLM – 开源的PDF转播客AI工具,能自定义语气
Open NotebookLM 是一个开源的AI工具,基于最...
135
0
AI语音助手
MiniCPM-o 2.6 – 面壁智能开源的多模态大模型,性能媲美GPT-4o
MiniCPM-o 2.6 是MiniCPM-o 系列最新...
135
0
AI语音助手
F5-TTS – 上海交大推出开源的文本到语音(TTS)合成系统
F5-TTS是由上海交通大学开源的一款高性能文本到语音(TT...
135
0
AI语音助手
TIGER – 清华大学推出的轻量级语音分离模型
TIGER(Time-frequency Interleav...
134
0
AI语音助手
TEN VAD – AI实时语音活动检测系统,低延迟、轻量级、高精度
TEN VAD 是高性能的实时语音活动检测系统,专为企业级应...
133
0
AI语音助手
GPT-4o – OpenAI最新发布的多模态AI大模型
GPT-4o是OpenAI最新推出的一款先进的人工智能模型...
132
0
AI语音助手
ebook2audiobookXTTS – 开源电子书转有声书 AI 工具,支持16种语言
ebook2audiobookXTTS是开源的AI工具,能将...
132
0
AI语音助手
WhisperChain – AI实时语音转文字工具,自动对文本进行清理和优化
WhisperChain 是开源的 语音识别工具 ,基于语音...
131
0
AI语音助手
悦录 – AI语音转文字工具,支持多种语言和方言、准确率高达95%+
悦录是 AI语音转文字工具 ,基于同花顺的智能语音、自然语言...
131
0
AI语音助手
RTranslator – 开源的离线、实时、多语言翻译应用程序
RTranslator 是一款开源、免费、离线实时翻译应用程...
130
0
AI语音助手
交交 – 上海交大推出的口语对话情感大模型
交交是上海交通大学听觉认知与计算声学实验室推出的全球首个纯学...
130
0
AI语音助手
LangBot – 多模态即时聊天机器人构建与管理的开源平台
LangBot 是开源的即时 聊天机器人 平台,支持多平台...
129
0
AI语音助手
Realtime API – OpenAI推出的实时语音交互API
Realtime API是OpenAI推出的一种低延迟、多模...
128
0
AI语音助手
FeedMe – 多源RSS内容聚合AI工具,一站式获取最新内容
FeedMe 是专为 Android 设计的离线 RSS 阅...
128
0
AI语音助手
OSUM – 西北工业大学开源的语音理解模型
OSUM(Open Speech Understanding...
127
0
AI语音助手
OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音
OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建...
127
0
AI语音助手
OmniAudio-2.6B – Nexa AI推出的端侧多模态音频语言模型
OmniAudio-2.6B是Nexa AI推出的音频语言模...
127
0
AI语音助手
Ultravox – 端到端多模态大模型,直接理解文本和人类语音
Ultravox是新型的多模态大型语言模型(LLM),能直接...
126
0
AI语音助手
Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
Parakeet TDT 0.6B 是英伟达推出的开源自动 ...
125
0
AI语音助手
MooER – 摩尔线程推出的业界首个音频理解大模型
MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的...
125
0
AI语音助手
MaskGCT – 趣丸科技联合香港中文大学推出的语音合成大模型
MaskGCT是趣丸科技与香港中文大学(深圳)合作推出的语音...
125
0
AI语音助手
Voila – 开源端到端语音大模型,实现低延迟语音对话
Voila 是开源的端到端语音大模型,专为语音交互而设计。具...
123
0
AI语音助手
Emote – AI生活管理笔记,实时转录语音快速记录笔记内容
Emote是AI互动记录的聊天式笔记,帮助用户轻松记录和追踪...
123
0
AI语音助手
VoxInstruct – 清华推出的开源语音合成技术,支持多语言和跨语言合成
VoxInstruct 是由清华大学开源的语音合成技术,能根...
122
0
AI语音助手
EMOVA – 华为诺亚方舟联合多所高校共同推出的多模态全能处理模型
EMOVA(EMotionally Omni-present...
122
0
AI语音助手
Seed-VC – 零样本实现声音克隆和转换的技术
Seed-VC 是一种零样本声音转换技术,基于上下文学习实现...
121
0
AI语音助手
PodAgent – 港中文、微软、小红书联合推出的播客生成框架
PodAgent 是香港中文大学、微软和小红书联合推出的播客...
121
0
AI语音助手
加载更多
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈