OCR文档识别的工作原理

2021-06-21 11:51:28 阅读：171 来源： 互联网

云脉文档管理系统便是一款基于OCR、图像处理及秒级全文检索等技术的企业级数据管理方案。其核心技术就是OCR，那OCR是什么呢，其实现的核心步骤又是什么呢？

Ocr是什么？OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。
核心步骤如下：

图像预处理：图像预处理的目的主要是为了更好的文本行定位和识别，从而提高识别准确率，同时也可以进行图像美化，将美化的效果展现给客户，让客户更容易的进行校对和存储，常用的图像预处理模块有：去背景、倾斜矫正、透视变换、图像增强、方向校正、反光处理、反白处理等）。

文本行定位：即将文档图像的所有文本行进行定位，文本行定位的准确性直接影响到后面的文字识别和版面分析的整体效果。

文本行识别：OCR核心算法,对文本行文字信息转换成可编辑的文字信息，

后处理：根据规则和大数据分析（nlp）对识别结果进行矫正，提高字符识别的准确率。

版面还原：将识别结果按原文本图像原来的版面还原到word文档或excel表格或者web界面，具体功能包括表格分析、段落分析、顺序还原等。

标签：字符识别,OCR,识别,文档,图像,文本
来源： https://blog.51cto.com/u_10243765/2930305

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

OCR文档识别的工作原理