谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

4个月前发布 135 00

在人工智能领域，谷歌旗下的DeepMind公司再次取得突破性进展，推出了一款名为V2A（Video-to-Audio，视频到音频）的AI模型。该项技术能够将视频像素与文本提示相结合，为无声视频生成包含对话、音效和音乐的详细音频轨道。官网：https://deepmind.google/discover/blog/generating-au...

收录时间：

2025-12-16

打开网站手机查看

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

在人工智能领域，谷歌旗下的DeepMind公司再次取得突破性进展，推出了一款名为V2A（Video-to-Audio，视频到音频）的AI模型。该项技术能够将视频像素与文本提示相结合，为无声视频生成包含对话、音效和音乐的详细音频轨道。

官网：https://deepmind.google/discover/blog/generating-audio-for-video/

立即打开官网

数据统计

相关导航

TransPixar – 港中文联合 Adobe 等机构开源的生成透明背景视频技术

TransPixar是香港中文大学、Adobe研究院、香港...

Enhance-A-Video – 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

Enhance-A-Video 是新加坡国立大学、上海人工智...

Oasis – Decart联合Etched推出首款AI实时生成的游戏系统

Oasis是世界上首款AI实时生成的游戏，由Decart和E...

TesserAct – AI 4D具身世界模型，能预测3D场景的动态演变

TesserAct 是创新的 4D 具身世界模型，能预测 3...

FlexIP – 腾讯推出的个性化图像生成编辑框架

FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架...

Qwen2.5-VL – 阿里通义千问开源的视觉语言模型

Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型...

VideoChat-Flash – 上海 AI Lab 等机构推出针对长视频建模的多模态大模型

VideoChat-Flash 是上海人工智能实验室和南京大...

MultiFoley – Adobe 联合密歇根大学推出的音效生成系统

MultiFoley是Adobe Research和密歇根大...