Marker 是开源的高精度文档转换工具,专注于将 PDF、Word 等多种文档格式快速、准确地转换为 Markdown、JSON 和 HTML 格式。通过深度学习技术,自动去除页眉、页脚等干扰元素,同时支持多语言处理,能智能识别并格式化表格、代码块,提取图像,将公式转换为 LaTeX 格式,确保内容的完整性和准确性。官网:https...
Marker 是开源的高精度文档转换工具,专注于将 PDF、Word 等多种文档格式快速、准确地转换为 Markdown、JSON 和 HTML 格式。通过深度学习技术,自动去除页眉、页脚等干扰元素,同时支持多语言处理,能智能识别并格式化表格、代码块,提取图像,将公式转换为 LaTeX 格式,确保内容的完整性和准确性。
官网:https://github.com/vikParuchuri/marker
立即打开官网