FineVideo – Hugging Face推出的大型多模态视频数据集
FineVideo是由Hugging Face推出的一个大型...
在人工智能领域,谷歌旗下的DeepMind公司再次取得突破性进展,推出了一款名为V2A(Video-to-Audio,视频到音频)的AI模型。该项技术能够将视频像素与文本提示相结合,为无声视频生成包含对话、音效和音乐的详细音频轨道。
官网:https://deepmind.google/discover/blog/generating-audio-for-video/