Dolphin – 字节跳动开源的文档解析大模型

1个月前发布 48 00

Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphin在多种文档解析任务上表现出色,性能超越 GPT-4.1 、 Mistral-OCR 等模型。Dolphin 具有322M参数,体积小、速度快,支持多种文档元素解...

收录时间:
2025-12-16
Dolphin – 字节跳动开源的文档解析大模型Dolphin – 字节跳动开源的文档解析大模型

Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphin在多种文档解析任务上表现出色,性能超越 GPT-4.1 、 Mistral-OCR 等模型。Dolphin 具有322M参数,体积小、速度快,支持多种文档元素解析,包括文本、表格、公式等。Dolphin的代码和预训练模型已公开,方便开发者使用和研究。

官网:https://github.com/bytedance/Dolphin


立即打开官网

数据统计

相关导航