图像识别tesseract-ocr
tesseract-ocr可以对图像文字进行识别,可以自己调试模型使图像文字进行程序的识别率更高,同时为图文转换的工作时省去了大量时间。
工具/原料
电脑一台
linux服务器一台
安装编译环境
1、gcc安装使用的内容是基础环境,虽然大部分机子上面都有,但也不排除没有的,所以还是安装一遍检查下。
2、 使用图片中的命令,下载leptonica文件。 使用tar xv酆璁冻嘌f 解压之前下载的文件,下载之后进入解压后的文件。./configure;make ; make install进行安装,安装的leptonic是tesseract-ocr的支持部件,使用tesseract,leptonic是必须安装的
3、 下载tesseract-ocr主体,使用图片中的命令。
4、 同样使用tar xvf进行对下载文件的解压,之后进入解压后的文件捂执涡扔使用./autogen.shmkdir m4;./configuremake;make install 进行对tesseract的安装
5、 具体是世界使用,tesseract (图片名称) out(转换的文字),虽然使用的转换成功率不高,还是有错误的问题,用户可以自己建立相应的模型,这样会提高识别率。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:94
阅读量:85
阅读量:39
阅读量:32
阅读量:41