AI工具库
次级导航
  • blog
  • 关于
    • 收录投稿
    • 二级菜单样式
  • 获取主题
  • 排行榜
  • 收录投稿
    • blog
    • 关于
      • 收录投稿
      • 二级菜单样式
    • 获取主题
    • 排行榜
    • 收录投稿

    AI语音助手

    共 147 篇网址
    AI写作工具AI图像工具AI视频工具AI办公工具AI音频工具AI搜索工具AI学习平台AI工具AI语音助手AI图像处理AI智能体AI图像生成AI翻译工具
    排序
    发布更新浏览点赞
    Step-Audio-TTS-3B – 高性能 TTS 模型,能生成特定情感和说唱风格的语音

    Step-Audio-TTS-3B – 高性能 TTS 模型,能生成特定情感和说唱风格的语音

    Step-Audio-TTS-3B 是 Stepfun-AI...
    510
    AI语音助手
    Step-Audio – 阶跃星辰开源的语音交互模型

    Step-Audio – 阶跃星辰开源的语音交互模型

    Step-Audio是阶跃星辰团队推出的首个产品级的开源语音...
    290
    AI语音助手
    SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型

    SpeechGPT 2.0-preview – 复旦大学推出的端到端实时语音交互模型

    SpeechGPT 2.0-preview 是复旦大学 Op...
    240
    AI语音助手
    Spirit LM – Meta推出多模态语言模型,无缝集成语音和文本

    Spirit LM – Meta推出多模态语言模型,无缝集成语音和文本

    Spirit LM是由Meta AI团队推出的一种多模态语言...
    350
    AI语音助手
    Speech-02 – MiniMax 推出的新一代文本转语音模型

    Speech-02 – MiniMax 推出的新一代文本转语音模型

    Speech-02 是 MiniMax 推出的新一代 文本到...
    300
    AI语音助手
    Soundwave – 港中文深圳开源的语音理解大模型

    Soundwave – 港中文深圳开源的语音理解大模型

    Soundwave是香港中文大学(深圳)开源的语音理解大模型...
    310
    AI语音助手
    Spark-TTS – AI文本转语音工具,支持中英零样本语音克隆

    Spark-TTS – AI文本转语音工具,支持中英零样本语音克隆

    Spark-TTS 是SparkAudio 团队开源的基于大...
    450
    AI语音助手
    SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统

    SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统

    SOLAMI是创新的VR端3D角色扮演AI系统,是南洋理工大...
    300
    AI语音助手
    SeniorTalk – 智源联合南开开源的超高龄老年人中文对话语音数据集

    SeniorTalk – 智源联合南开开源的超高龄老年人中文对话语音数据集

    SeniorTalk 是智源研究院联合南开大学计算机学院人类...
    270
    AI语音助手
    Seed-VC – 零样本实现声音克隆和转换的技术

    Seed-VC – 零样本实现声音克隆和转换的技术

    Seed-VC 是一种零样本声音转换技术,基于上下文学习实现...
    300
    AI语音助手
    SafeEar – 浙大和清华联合开源的AI音频伪造检测框架

    SafeEar – 浙大和清华联合开源的AI音频伪造检测框架

    SafeEar是由浙江大学和清华大学联合开发的AI音频伪造检...
    490
    AI语音助手
    RTranslator – 开源的离线、实时、多语言翻译应用程序

    RTranslator – 开源的离线、实时、多语言翻译应用程序

    RTranslator 是一款开源、免费、离线实时翻译应用程...
    360
    AI语音助手
    Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型

    Reverb ASR – Rev公司开源的自动语音识别和说话人分离模型

    Reverb ASR是Rev公司推出的开源自动语音识别和说话...
    270
    AI语音助手
    Realtime API – OpenAI推出的实时语音交互API

    Realtime API – OpenAI推出的实时语音交互API

    Realtime API是OpenAI推出的一种低延迟、多模...
    400
    AI语音助手
    RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束

    RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束

    RealtimeSTT是开源的实时 语音转文本 库,专为低延...
    470
    AI语音助手
    PodAgent – 港中文、微软、小红书联合推出的播客生成框架

    PodAgent – 港中文、微软、小红书联合推出的播客生成框架

    PodAgent 是香港中文大学、微软和小红书联合推出的播客...
    340
    AI语音助手
    Pipecat – 构建语音和多模态对话代理的开源框架

    Pipecat – 构建语音和多模态对话代理的开源框架

    Pipecat是开源的Python框架,专注于构建语音和多模...
    300
    AI语音助手
    Phi-4-Multimodal – 微软最新推出的多模态语言模型

    Phi-4-Multimodal – 微软最新推出的多模态语言模型

    Phi-4-Multimodal 是微软最新推出的多模态语言...
    360
    AI语音助手
    PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具

    PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具

    PDF to Podcast是NVIDIA推出的PDF转音频...
    270
    AI语音助手
    Parler-TTS – Hugging Face开源的文本转语音模型

    Parler-TTS – Hugging Face开源的文本转语音模型

    Parler-TTS是由Hugging Face推出的一款开...
    400
    AI语音助手
    Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型

    Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型

    Parakeet TDT 0.6B 是英伟达推出的开源自动 ...
    320
    AI语音助手
    PaddleSpeech – 百度飞桨团队开源的语音处理工具

    PaddleSpeech – 百度飞桨团队开源的语音处理工具

    PaddleSpeech 是百度飞桨团队开源的语音处理工具...
    250
    AI语音助手
    Orpheus TTS – 开源AI语音合成系统,支持多种语音风格

    Orpheus TTS – 开源AI语音合成系统,支持多种语音风格

    Orpheus TTS 是基于 Llama-3b 架构的开源...
    490
    AI语音助手
    OSUM – 西北工业大学开源的语音理解模型

    OSUM – 西北工业大学开源的语音理解模型

    OSUM(Open Speech Understanding...
    370
    AI语音助手
    OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音

    OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音

    OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建...
    380
    AI语音助手
    OpenVoice – 免费开源的AI语音克隆项目

    OpenVoice – 免费开源的AI语音克隆项目

    OpenVoice是由MyShell推出的一个免费开源的AI...
    350
    AI语音助手
    GPT-4o – OpenAI最新发布的多模态AI大模型

    GPT-4o – OpenAI最新发布的多模态AI大模型

    GPT-4o是OpenAI最新推出的一款先进的人工智能模型...
    440
    AI语音助手
    Voice Engine – OpenAI公布的AI语音合成和声音克隆模型

    Voice Engine – OpenAI公布的AI语音合成和声音克隆模型

    Voice Engine是OpenAI最新公布的一项AI语音...
    440
    AI语音助手
    Open-LLM-VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知

    Open-LLM-VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知

    Open-LLM-VTuber 是开源的跨平台语音交互 AI...
    300
    AI语音助手
    OmniAudio-2.6B – Nexa AI推出的端侧多模态音频语言模型

    OmniAudio-2.6B – Nexa AI推出的端侧多模态音频语言模型

    OmniAudio-2.6B是Nexa AI推出的音频语言模...
    390
    AI语音助手
    加载更多

    标签云

    AI工具库
    作为一站式 AI 工具导航平台,本站聚焦 AI 软件资源聚合,帮用户跳出零散搜索的繁琐 —— 从设计创作、办公效率到数据处理、智能交互类 AI 工具,这里均已分类整理,无需逐个筛选,点击即可直达目标工具,让每一次使用 AI 的需求,都能高效落地。

    友链申请免责声明广告合作关于我们

    扫码加QQ群AI工具库
    扫码加QQ群
    扫码加微信AI工具库
    扫码加微信


      
    反馈
    让我们一起共建文明社区!您的反馈至关重要!