如何用Python从PDF文件中导出数据
1、打开pycharm工具,点击File--颍骈城茇->Settings,打开可利用的包,安装pdfminer2
2、新建一个Python文件,依次导入io和pdfminer(模块中的类)
3、定义函数show_data,传入参数文件路径;循环遍历pdf文档,获取内部文字内容
4、再定义一个函数et,参数还是文档路径;调用show_data,使用for...in语句遍历循谪藁钴碳环,打印内容
5、使用if语句判断__name__是否等于__main__,打印并调用et,传入pdf文件路径
6、保存代码并使用Python应用运行,结果控制台出现了报错,文件找不到
7、拷贝一个user.pdf文件到Python文件同级目录,然后运行Python文件
8、可以在控制台查看到打印结果,和pdf文件内容进行对比,一致
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:47
阅读量:94
阅读量:95
阅读量:35
阅读量:68