跳到主要内容

OCR技术

光学字符识别（OCR）技术专题，涵盖OCR技术原理、算法演进、主流开源框架、模型优化、场景应用等内容。包括文本检测、文本识别、版面分析、表格识别等核心技术，以及中英文混合识别、手写体识别、公式识别等专项技术。

📄️ PaddleOCR

百度开源的OCR工具库，支持80+语言识别

📄️ DeepSeek OCR

DeepSeek推出的视觉语言模型，支持文档理解和OCR任务

📄️ GOT-OCR

通用OCR理论模型，支持多种OCR任务的统一处理

📄️ Monkey OCR

面向文本密集场景的高精度OCR模型

📄️ PaddleOCR-VL

基于视觉语言模型的PaddleOCR升级版，智能文档理解

📄️ dots-ocr

统一的视觉语言模型