DiT – 基于Transfomer架构的扩散模型

1个月前发布 28 00

DiT(Diffusion Transformers)是一种新型的扩散模型,由William Peebles(Sora的研发负责人之一) 与纽约大学助理教授谢赛宁提出,结合了去噪扩散概率模型(DDPMs)和Transformer架构。扩散模型是一种生成模型,通过模拟数据的逐步去噪过程来生成新的样本。DiT的核心思想是使用Transform...

收录时间:
2025-12-16
DiT – 基于Transfomer架构的扩散模型DiT – 基于Transfomer架构的扩散模型

DiT(Diffusion Transformers)是一种新型的扩散模型,由William Peebles(Sora的研发负责人之一) 与纽约大学助理教授谢赛宁提出,结合了去噪扩散概率模型(DDPMs)和Transformer架构。扩散模型是一种生成模型,通过模拟数据的逐步去噪过程来生成新的样本。DiT的核心思想是使用Transformer作为扩散模型的骨干网络,而不是传统的卷积神经网络(如U-Net),以处理图像的潜在表示。近期伴随OpenAI视频生成模型 Sora 的大热,DiT被视为Sora背后的技术基础之一而广受关注。

官网:https://www.wpeebles.com/DiT


立即打开官网

数据统计

相关导航