Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型

4个月前发布 134 00

Seedream 2.0 是字节跳动豆包大模型团队推出的原生中英双语图像生成模型，解决现有模型在文本渲染、文化理解等方面的不足。模型通过自研的双语大语言模型（LLM）作为文本编码器，能直接从海量数据中学习本土知识，生成具有准确文化细节和审美表达的高保真图像。Seedream 2.0 应用了 Glyph-Aligned ByT5 模型进...

收录时间：

2025-12-16

打开网站手机查看

Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型

Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型

Seedream 2.0 是字节跳动豆包大模型团队推出的原生中英双语图像生成模型，解决现有模型在文本渲染、文化理解等方面的不足。模型通过自研的双语大语言模型（LLM）作为文本编码器，能直接从海量数据中学习本土知识，生成具有准确文化细节和审美表达的高保真图像。Seedream 2.0 应用了 Glyph-Aligned ByT5 模型进行灵活的字符级文本渲染，通过 Scaled ROPE 技术实现对未训练分辨率的泛化。

官网：https://arxiv.org/pdf/2503.07703

立即打开官网

数据统计

相关导航

XiYan-SQL – 阿里推出文本到SQL的多生成器集成框架

XiYan-SQL是阿里巴巴推出的自然语言到SQL（NL2S...

Miras – 谷歌推出的深度学习架构设计通用框架

Miras是谷歌推出的用在深度学习架构设计的通用框架，特别是...

HybridRAG – 黑石联合英伟达推出的混合检索增强生成架构

HybridRAG 是黑石联合英伟达推出的混合检索增强生成架...

MagicMan – 腾讯联合多所高校推出2D图像生成3D人类模型的AI项目

MagicMan 是清华大学深圳国际研究生院、腾讯AI实验室...

xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架

xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视...

LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型

LLaDA（Large Language Diffusion...

Vanna – 开源AI检索生成框架，自动生成精确的SQL查询

Vanna是开源的Python RAG（Retrieval...

Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型

Meta Motivo 是 Meta 公司推出的AI模型，能...