SlideChat – 上海AI Lab联合多所高校和机构推出的视觉语言助手
SlideChat是上海AI实验室、厦门大学、华东师范大学等...
MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是先进的 3D场景生成 技术,能在短时间内将单张图像转化为高保真度的3D场景。通过智能分割输入图像,识别出场景中的独立元素,再基于多实例扩散模型,结合注意力机制,生成360度的3D场景。具有强大的全局感知能力和细节表现力,能在40秒内完成生成,对不同风格的图像具有良好的泛化能力。