提取图片中文字信息怎么实现

2026-04-26 14:23:17

1、源代码如下

from PIL import Image

import pytesseract

text=pytesseract.image_to_string(Image.open('test.jpg'),lang='chi_sim')

print(text)

提取图片中文字信息怎么实现

2、然后展示一下代码的架构

提取图片中文字信息怎么实现

3、执行效果如下图

提取图片中文字信息怎么实现

1、第一步：导入pytesseract模块

pip install pytesseract

提取图片中文字信息怎么实现

2、第二步：导入PIL模块

pip install PIL

这个可能会出错，原因：PIL仅支持python2.7，所以我们需要导入Pillow

提取图片中文字信息怎么实现

3、在第二步不行的时候，执行这个第三步。

导入Pillow模块：

导入Pillow模块的第一种方法：

pip install pillow

提取图片中文字信息怎么实现

4、第二种安装pillow模块的方法：

下载whl文件安装

（1）安装wheel模块（因为要安装wheel文件，所以需要导入该模块）

（2）安装.wheel文件

提取图片中文字信息怎么实现

1、官方没有提供最新版windows平台的安装报，只有相对较老的3.02.02版本

下载地址：如图（也可以自己百度一下）

提取图片中文字信息怎么实现

1、打开python安装目录中 Lib -à site-packages -- ->pytesseract

提取图片中文字信息怎么实现

2、打开pytesseract.py文件

搜索tesseract_cmd，将其最开始赋值的位置，值改为刚才安装的识别引擎中的tesseract.exe路径（注意路径设置的时候应该满足python语法）

提取图片中文字信息怎么实现

1、由于下载的识别引擎是默认识别英文，不支持中文，所以我们需要下载中文语言包

下载地址：如图（可以根据关键字百度）

提取图片中文字信息怎么实现

2、将其下载的文件放在tesseract-orc目录下的tessdate目录

提取图片中文字信息怎么实现

3、在这些设置完成之后，就可以得到最初的那种效果了

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。