DIAMOND – 能模拟虚拟环境的强化学习代理

1个月前发布 89 00

DIAMOND(DIffusion As a Model Of eNvironment Dreams)是新型的强化学习代理,完全在扩散世界模型中进行训练。DIAMOND能模拟和学习复杂的环境动态。模型基于扩散模型的最新进展,生成高质量的视觉内容,为代理提供丰富的学习和决策环境。在Atari游戏和3D环境中,如CSGO,DIAMOND展示了...

收录时间:
2025-12-16
DIAMOND – 能模拟虚拟环境的强化学习代理DIAMOND – 能模拟虚拟环境的强化学习代理

DIAMOND(DIffusion As a Model Of eNvironment Dreams)是新型的强化学习代理,完全在扩散世界模型中进行训练。DIAMOND能模拟和学习复杂的环境动态。模型基于扩散模型的最新进展,生成高质量的视觉内容,为代理提供丰富的学习和决策环境。在Atari游戏和3D环境中,如CSGO,DIAMOND展示了卓越的性能,能以细节水平捕捉游戏的视觉效果。与传统的基于离散潜在变量的方法相比,DIAMOND能更好地保留环境中的重要视觉信息。

官网:https://github.com/eloialonso/diamond/tree/csgo


立即打开官网

数据统计

相关导航