提取图片中文字信息怎么实现
1、源代码如下
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('test.jpg'),lang='chi_sim')
print(text)

2、然后展示一下代码的架构


3、执行效果如下图

1、第一步: 导入pytesseract模块
pip install pytesseract

2、第二步:导入PIL模块
pip install PIL
这个可能会出错,原因:PIL仅支持python2.7,所以我们需要导入Pillow

3、在第二步不行的时候,执行这个第三步。
导入Pillow模块:
导入Pillow模块的第一种方法:
pip install pillow

4、第二种安装pillow模块的方法:
下载whl文件安装
(1)安装wheel模块(因为要安装wheel文件,所以需要导入该模块)
(2)安装.wheel文件



1、官方没有提供最新版windows平台的安装报,只有相对较老的3.02.02版本
下载地址:如图(也可以自己百度一下)

1、打开python安装目录中 Lib -à site-packages -- ->pytesseract

2、打开pytesseract.py文件
搜索tesseract_cmd,将其最开始赋值的位置,值改为刚才安装的识别引擎中的tesseract.exe路径 (注意路径设置的时候应该满足python语法)


1、由于下载的识别引擎是默认识别英文,不支持中文,所以我们需要下载中文语言包
下载地址:如图(可以根据关键字百度)

2、将其下载的文件放在tesseract-orc目录下的tessdate目录

3、在这些设置完成之后,就可以得到最初的那种效果了