UniToken – 复旦联合美团等机构推出的统一视觉编码框架

1个月前发布 37 00

UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像的高级语义和低级细节。使 UniToken 可以无缝支持视觉理解和图像生成任务,为不同任务提供多维度信息。官网:https://github.com/SxJyJay/UniToken 立即打开官...

收录时间:
2025-12-16
UniToken – 复旦联合美团等机构推出的统一视觉编码框架UniToken – 复旦联合美团等机构推出的统一视觉编码框架