二次元漫画网 加入收藏  -  设为首页
您的位置:二次元漫画网 > 知识百科 > 正文
如何使用清华紫光OCR
如何使用清华紫光OCR
提示:

如何使用清华紫光OCR

应该可以用,我就直接用清华紫光TH-OCR XP版
文件->打开,选择要识别的文件,可以是tif、bmp、jpg格式的
命令->识别,会自动识别的
识别完成后,软件左边的树状栏里会有图像文件名,用鼠标点开哪个加号,就是识别后的文本文件
单击它,软件右边上方是识别后的文本,下方是被识别的图像文件
这时用键盘移动光标,就能查看图像和对应文本,并能直接改动文本

二值图像就是只有黑白两色的图像,用windows自带的画图软件就能做出来
先用画图打开图像,图像->属性,将颜色改成黑白,再存盘就得到二值图像了
其它图形图像软件都有这个功能

关于扫描版电子书 转换 txt 的问题,急等回答!!!!!
提示:

关于扫描版电子书 转换 txt 的问题,急等回答!!!!!

http://download.cnool.net:8080/pub/download/qtgjrj/ocr2000.rar
这个软件就可以
具体操作
具体操作才是本文的重头戏。
我是这么干的:
0:用清华TH-OCR 2000千禧专业版上面的扫描打开我的扫描程序

1:两页一扫。通过预览确定所有的文字都在扫描的范围之内。由于清华TH-OCR 2000千禧专业版的旋转功能只支持90度。所以把书放在只需让软件转一次90度的位置上。(有的扫描仪本身的驱动程序支持硬件旋转如果有就用这个那会更方便)
2:调整。我使用的是300dpi灰度扫描。其他选项均为默认对于印刷较为清晰的书来说这样就可以了。
如果印刷不佳可以先实验性质的修改亮度等参数经过识别后,选择识别率最高的参数设置,然后进行批量扫描。扫描的时候书尽量的摊开。

你会发现经过扫描的图档很整齐的排列在软件的左侧。接下来旋转每个图,把他们放正,最重要的是选好两个识别区域(最好分开框)才可以正确识别。有必要时使用倾斜矫正(放书的时候放正就可以不必矫正)一般十个图(20页书)一起识别,机器快的人还可以利用此识别时间继续命令扫描软件继续扫描书。
识别完成后,进入我们最艰苦的后编辑状态,如果前面的工作做的好,这时差错就少,很省力,如果错误太多,那就重新扫一遍那一页吧-_-。编辑校对完后就可以批量输出了。富有觉知的看输出菜单,输出为TXT文件,多文件一起输出,无硬回车(在右边一个按钮的选项里)。
如果你发现输出文件中的汉字后面都有空格觉得不爽,可以到清华TH-OCR 2000千禧专业版的选项中去改掉。
还有扫描仪的灯管,回来的时候是不扫描的,心急的你可以乘机把书拿出来换页,再按扫描键即可。


另:有的扫描仪有快捷键支持直接输出中文,然而我不推荐,因为输出的中文没有后编辑模式,校对的时候还得照着书,非常的不方便。此外,直接输出的中文识别率很不理想。


参考资料: http://download.cnool.net:8080/pub/download/qtgjrj/ocr2000.rar

答案内容来源百度知道