Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型

4个月前发布 191 00

Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型，拥有听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。作为平替 GPT-4o 的开源模型，Moshi在普通笔记本上即可运行，具有低延迟特性，支持本地设备使用，保护用户隐私。Moshi的开发和训练流程简单高效，由8人团队在6个月内完成，将很快...

收录时间：

2025-12-16

打开网站手机查看

Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型

Moshi – 法国AI实验室Kyutai开发的实时音频多模态模型

Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型，拥有听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。作为平替 GPT-4o 的开源模型，Moshi在普通笔记本上即可运行，具有低延迟特性，支持本地设备使用，保护用户隐私。Moshi的开发和训练流程简单高效，由8人团队在6个月内完成，将很快开源模型的代码、权重和技术论文，免费供全球用户使用和进一步研究开发。

官网：https://moshi.chat/?queue_id=talktomoshi

立即打开官网

数据统计

相关导航

MuCodec – 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香...

咔嗒 – AI图片处理软件，精准识别各种场景和物体智能匹配滤镜

咔嗒是基于AI技术的图片处理软件。能识别各种场景和物体，自动...

R1-Omni – 阿里通义开源的全模态大语言模型

R1-Omni 是阿里通义推出的基于强化学习（RLVR）的全...

Gradio – 开源的Python库，快速创建机器学习模型的交互式网页

Gradio 是一个开源的 Python 库，简化机器学习模...

ChatMusician – 可理解和生成音乐的大模型

ChatMusician是由Multimodal Art P...

Kimi-Audio – Moonshot AI 开源的音频基础模型

Kimi-Audio 是 Moonshot AI 推出的开源...

Hertz-Dev – Standard Intelligence推出8.5亿参数的开源音频模型

Hertz-Dev是Standard Intelligenc...

MnnLlmApp – 阿里巴巴开源的离线大模型 Android 手机应用AI助手

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源...