Gen2Act – 谷歌、卡内基梅隆、斯坦福联合推出生成人类视频引导机器人操作策略
Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学共同推出的...
在人工智能领域,谷歌旗下的DeepMind公司再次取得突破性进展,推出了一款名为V2A(Video-to-Audio,视频到音频)的AI模型。该项技术能够将视频像素与文本提示相结合,为无声视频生成包含对话、音效和音乐的详细音频轨道。
官网:https://deepmind.google/discover/blog/generating-audio-for-video/