T2V-Turbo – 谷歌开源的文本到视频生成模型
T2V-Turbo是一种先进的文本到视频生成模型,由Goog...
TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agent能实现语音、文本、图像的多模态交互, 具备天气查询、网络搜索、视觉识别、 RAG 能力, 支持高性能的实时通信,具备低延迟的音视频交互能力。TEN Agent支持多语言和跨平台操作,支持开发者基于模块化设计轻松扩展功能,如集成视觉识别和RAG能力。TEN Agent提供实时代理状态管理,让AI代理动态响应用户交互,适用于智能客服、实时语音助手等多种场景。