ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型
ConsisID是北京大学和鹏城实验室等机构推出的文本到视频...
FunClip是阿里达摩院通义实验室推出的一款完全开源、本地部署的自动化 视频剪辑工具 ,通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音识别。用户可以根据识别结果,选择文本片段或特定说话人,快速裁剪出所需视频片段。FunClip的特色包括集成高精度的中文ASR模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,使得视频剪辑变得简单方便。此外,它还支持多段剪辑,并能自动生成SRT字幕文件。