Vision Parse – 开源的 PDF 转 Markdown 工具

4个月前发布 183 00

Vision Parse是开源的PDF文档转换工具，基于视觉语言模型（Vision LLMs）将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格，且保持原有的格式和结构。Vision Parse支持多种视觉语言模型，如OpenAI、LLama、Gemini等，来提高解析的准确性和速度。用户...

收录时间：

2025-12-16

打开网站手机查看

AI表格数据处理

Vision Parse – 开源的 PDF 转 Markdown 工具

Vision Parse – 开源的 PDF 转 Markdown 工具

Vision Parse是开源的PDF文档转换工具，基于视觉语言模型（Vision LLMs）将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格，且保持原有的格式和结构。Vision Parse支持多种视觉语言模型，如OpenAI、LLama、Gemini等，来提高解析的准确性和速度。用户通过Python环境安装并使用Vision Parse，实现文档的高效转换。

官网：https://github.com/iamarunbrahma/vision-parse

立即打开官网

数据统计

相关导航

AutoAgent – 港大推出的 AI 智能体框架，零代码创建智能助手

AutoAgent 是香港大学推出的零代码、自动化 LLM ...

Versatile-OCR-Program – 开源多模态OCR工具，精准提取复杂结构化数据

Versatile-OCR-Program是开源多模态OCR...

Marker – AI文档转换工具，多格式转换为 Markdown、JSON、HTML

Marker 是开源的高精度文档转换工具，专注于将 PDF...

Pi智能演示文档

Pi（Presentation Intelligence）是...

PP-DocBee – 百度飞桨推出的文档图像理解多模态大模型

PP-DocBee是百度飞桨（PaddlePaddle）团队...

酷表ChatExcel – AI数据分析辅助工具，一句话即可操控Excel

酷表ChatExcel是北京大学团队元空AI推出的 AI数据...

DeepSeek-VL2 – DeepSeek最新开源的MoE视觉语言模型系列

DeepSeek-VL2是 DeepSeek 最新开源的一系...

Qlib – 微软开源的金融 AI 量化投资工具

Qlib 是微软亚洲研究院推出的面向金融行业的AI量化投资工...