点点 – 小红书推出的 AI 搜索助手,主打生活场景
点点是小红书推出的 AI搜索助手 ,主打生活服务场景的聚合搜...
LLIA(Low-Latency Interactive Avatars)是美团公司推出的基于扩散模型的实时音频驱动肖像 视频生成 框架。框架基于音频输入驱动虚拟形象的生成,支持实现低延迟、高保真度的实时交互。LLIA用可变长度视频生成技术,减少初始视频生成的延迟,结合一致性模型训练策略和模型量化技术,显著提升推理速度。LLIA支持用类别标签控制虚拟形象的状态(如说话、倾听、空闲)及面部表情的精细控制,为用户提供流畅且自然的交互体验。