Pixel Reasoner – 滑铁卢联合港科大等高校推出的视觉语言模型
Pixel Reasoner是滑铁卢大学、香港科技大学、中国...
Video-T1 是清华大学和腾讯的研究人员共同推出的 视频生成 技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在训练后直接生成视频,Video-T1 在测试阶段引入额外计算资源,基于动态调整生成路径优化视频质量。研究推出 Tree-of-Frames (ToF) 方法,将视频生成分为多个阶段,逐步优化帧的连贯性和与文本提示的匹配度。Video-T1 为视频生成领域提供新的优化思路,展示测试时扩展的强大潜力。