📄️ MinerU
高质量PDF文档解析工具,支持复杂版面和公式提取
📄️ Marker
快速将PDF转换为Markdown的工具,支持表格和公式
📄️ Docling
IBM开源的企业级文档解析工具,支持多种格式
📄️ MarkItDown
微软开源的通用文档转Markdown工具
📄️ 混元OCR
腾讯混元大模型OCR,智能文档理解与识别
📄️ OCRFlux
轻量级OCR工作流编排工具,灵活组合多种OCR引擎
📄️ Dolphin
高性能文档解析引擎,专注于生产环境部署
📄️ Chandra
Chandra 是一个开源 OCR 系统,适用于高精度的文档版面理解和结构化识别场景。它可以识别印刷与手写文字,还能准确重建复杂的表格、表单、复选框、数学公式和多栏布局。适用于批量文档解析、档案数字化、智能表单提取和多语言 OCR 等场景。