OCR技术之文档识别、公文识别SDK开发包

OCR文字识别是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题的友好性，产品的稳定性，易用性及可行性等。

编辑本段软件结构由于扫描仪的普及与广泛应用，OCR软件只需提供与扫描仪的接口，利用扫描仪驱动软件即可。因此，OCR软件主要是由下面几个部分组成：图像输入、预处理、版面分析、字符切割、字符识别、版面恢复、后处理、校对。

OCR识别技术

编辑本段工作流程一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。

从影像到结果输出，须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正，将结果输出。

产品描述

文通TH-OCR SOK 11，是北京文通科技有限公司研制开发的多语种亚洲语言文字识别软件开发包，提供强大的识别 API开发接口，帮助用户将 OCR 文字识别技术无缝内嵌到用户业务系统中，为数字资源的建立提供了方便、快捷、稳定的技术手段。

TH-OCR SOK 支持简体中文、繁体中文、日文、韩文、纯英文的文字识别，具有识别率高、适应性强等突出的技术优势。

OCR文档识别

特色功能

可以对图像由于扫描引起的倾斜进行自动校正；

支持对指定区域的识别；

可以对图像进行自动版面分析；

支持回调函数显示OCR 识别进度；

支持对内存中的图像进行识别；

能够获取识别字符在原文中的位置和大小信息；

支持USB key授权控制，序列号授权控制；

C语言编写的程序，并预留有VC、VB、DEPH、JAVA等开发语言的API；

提供OCX插件及DLL动态链接库方式的调用接口

能识别纯英文、简繁体中文、日文、韩文、中英文混排的文本图像；

根据识别结果能够进行版面恢复，并导出TXT 、RTF , XLS ，双层PDF等格式文件；

支持GB一2312 码（大陆使用上 BIG一5 码（台湾使用）、GBK 、Shift-JIS （日文使用）、KSC （韩文使用）内码的输出；

支持TIFF , JPEG, PCX , BMP 格式图像的读取，支持Pacleb its 和G4 压缩的TIFF格式；

可以对横排文本图像，纵排文本图像，表格文本图像、图形图像进行识别。

版本划分

通过拍照界面，指导用户拍出合格证件图像。

采用文字识别（OCR）技术，自动提取证件信息（如姓名、证件号码、地址等）及头像。

识别证件种类包括，身份证、名片、驾照、护照、港澳台证件、军官证等身份证件，以及行驶证、机动车VIN码、车牌号等车辆信息。

版本划分

标准版：标准版含三个开发进程，无识别页数限制，无时间期限限制

企业版：企业版不限制开发进程，无识别页数限制，无时间期限限制

配置要求

支持windows 32位、64位；linux 32位、64位；

CPU：586以上；

内存：256M以上。

图像规范

规范的扫描图像有助于提高识别率；

DPI，200至300dpi扫描分辨率是最佳的；

扫描尽量规范不倾斜。

智云一二三科技

OCR技术之文档识别、公文识别SDK开发包

关于作者: 智云科技

给这篇文章的作者打赏

关于作者: 智云科技

相关文章

Map和List的几种遍历方式

全网大佬都在用的Java+Python这两套视频学习教程，学习很重要

JavaWeb快速进阶全套教程(程序员必备2020版)：视频+笔记+源码

热门文章

1分享新浪图床上传接口源码

2PHP简单实现路由Route功能

3Tideways、xhprof 和 xhgui 打造 PHP 非侵入式监控平台

4centos系统如何查看是否安装了mysql

5curl 工具简述