如何提高ocr文字识别软件的转换准确率
1、 识别前所需的注意事项 ①认真处理原稿 OCR对原稿的要求是字符清晰、完整,无笔画间断;字符舍膺雕沆边缘锯齿不明显:文字摆放平行、水平。所以在识别前,应做一些预先的处理,比如去除杂点和图像。如文稿中含有图像,OCR足不能识别的,会影响OCR的文字切分。可使用“图像的块擦拭”工具将文档中的图像去除,同时将一些杂点去除。对于那些焦距不准、污损的图像.不管花费多大的精力进行处理效果都不会理想。原稿应该尽量平整、无皱折,如果原稿比较厚,你可以在扫描仪上盖上比较重的东西,使原稿紧贴玻璃板.以保证成像时景深致和原稿的边缘不漏光。
2、 ②确定合适的扫描参数 在选择设定扫描分辨率时,需要综合考虑扫描的图像类型和输出的方式。不一定用越高的扫描分辨率扫描,得到的图像就越消晰。过高的分辨率只会浪费磁盘空间。
3、 ③提高OCR识别率 首先,确定合适的扫描参数。为了达到最佳的识别效果.确定合适的扫描参数非常邓咀挚垡重要。一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对正确识别非常关键,我们可以通过”放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节.调节的工具是描仪工具内的”阀值”。对于分辨率,般300DPI是最住的分辨率。超过和低于300DPI都不能得到最理想的识别率。
4、 ④合理使用色彩校正功能 色彩校正是确保图像的色彩还原精确的程序。一般意义上的色彩校正,通常包含输入设备的校正和输出设备的校正。现在的扫描仪驱动一般都设计了内置的色彩校正系统,用来补偿色彩偏移,而色彩补偿系统则可以根据梅个型号的扫描仪的色彩特点对图像进行处理。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:45
阅读量:91
阅读量:82
阅读量:72
阅读量:92