Surya – 开源的OCR工具包,支持90+语言、布局分析等识别

1个月前发布 46 00

Surya是一款功能强大的开源OCR( 光学字符识别) 工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。Surya因高效的表格识别能力而闻名,性能优于许多现有的开源模型,如Table Transformer。Su...

收录时间:
2025-12-16
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别Surya – 开源的OCR工具包,支持90+语言、布局分析等识别

Surya是一款功能强大的开源OCR( 光学字符识别) 工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。Surya因高效的表格识别能力而闻名,性能优于许多现有的开源模型,如Table Transformer。Surya完全免费且用于商业用途,支持跨平台运行,包括Windows、Mac和Linux系统,适合处理敏感信息的离线环境。

官网:https://github.com/VikParuchuri/surya


立即打开官网

数据统计

相关导航