尚书七号OCR免费版是一款提供了多种图片以及文字识别功能的软件,软件支持对多种图片文字进行精准的提取,同时支持对提取后的内容进行编辑,编辑完成之后支持多种输出格式,一键选择更加便捷,通过对各种纸质文档进行扫描一键获取电子文档。
尚书七号OCR免费版安装
1.从本站下载后解压,双击Setup.exe开始安装。
2.点击下一步。
3.修改安装地址,点击下一步。
4.安装中。
5.安装完成,从开始菜单启动尚书七号OCR。
尚书七号OCR免费版亮点
1.识别字符:简体字符集:国标GB2312-80的全部一、二级汉字6800多个。纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
2.识别字体种类:能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
3.识别字号:初号 小六号字体。
4.表格识别:可以自动判断、拆分、识别和还原各种通用型印刷体表格。
5.尚书七号ocr可支持繁体WINDOWS系统
尚书七号OCR免费版使用方法
用尚书七号对文字图像识别转化的过程,利用其主菜单:“文件”、“编辑”、“识别”、“输出”可以很方便地完成。
具体步骤
1.获取文字图像文件
选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开)命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。
2.对扫描的图像页进行调整
选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”(提供自动和手动实现方法)及“旋转”等命令,将扫描的图像页进行调整。
3.版面分析与文字识别转化
版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。
尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。
设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。
4.校对修改
自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够提供识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法。
提供的校对方法,一眼就能够看到图像原文和识别出文本的差别,如果发现识别有误,可以进行修改。
5.输出
如果检查修改后确认无误,选择识别结果的“输出”菜单,输出的文件格式有:RTF、HTML、XLS、22238,可以根据自己的需要选择对应的格式。
如果用户想得到类似原文的识别结果,请选择RTF格式。把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。