📄️ PaddleOCR
百度开源的OCR工具库,支持80+语言识别
📄️ DeepSeek OCR
DeepSeek推出的视觉语言模型,支持文档理解和OCR任务
📄️ GOT-OCR
通用OCR理论模型,支持多种OCR任务的统一处理
📄️ Monkey OCR
面向文本密集场景的高精度OCR模型
📄️ PaddleOCR-VL
基于视觉语言模型的PaddleOCR升级版,智能文档理解
📄️ dots-ocr
统一的视觉语言模型
光学字符识别(OCR)技术专题,涵盖OCR技术原理、算法演进、主流开源框架、模型优化、场景应用等内容。包括文本检测、文本识别、版面分析、表格识别等核心技术,以及中英文混合识别、手写体识别、公式识别等专项技术。
百度开源的OCR工具库,支持80+语言识别
DeepSeek推出的视觉语言模型,支持文档理解和OCR任务
通用OCR理论模型,支持多种OCR任务的统一处理
面向文本密集场景的高精度OCR模型
基于视觉语言模型的PaddleOCR升级版,智能文档理解
统一的视觉语言模型