Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型

1个月前发布 39 00

Seedream 2.0 是字节跳动 豆包 大模型团队推出的原生中英双语图像生成模型,解决现有模型在文本渲染、文化理解等方面的不足。模型通过自研的双语大语言模型(LLM)作为文本编码器,能直接从海量数据中学习本土知识,生成具有准确文化细节和审美表达的高保真图像。Seedream 2.0 应用了 Glyph-Aligned ByT5 模型进...

收录时间:
2025-12-16
Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型

Seedream 2.0 是字节跳动 豆包 大模型团队推出的原生中英双语图像生成模型,解决现有模型在文本渲染、文化理解等方面的不足。模型通过自研的双语大语言模型(LLM)作为文本编码器,能直接从海量数据中学习本土知识,生成具有准确文化细节和审美表达的高保真图像。Seedream 2.0 应用了 Glyph-Aligned ByT5 模型进行灵活的字符级文本渲染,通过 Scaled ROPE 技术实现对未训练分辨率的泛化。

官网:https://arxiv.org/pdf/2503.07703


立即打开官网

数据统计

相关导航