Python pdfminer使用教程pdf文件处理
1、PDFParser:从一个文件中获取数据PDFDocument:保存获取的数据,和PDFParser是相互关联的PDFPageInterPReter处理页面内容PDFDevice将其翻译成你需要的格式PDFResourceManager用于存储共享资源,如字体或图像。


4、from pdfminer.pdfparser import PDFParser, PDFDocumentfile=open(path, 'rb')parser=PDFParser(file)document=PDFDocument()parser.set_document(document)document.set_parser(parser)document.initialize(password)outlines=document.get_outlines()for (level,title,dest,a,se) in outlines: print (level, title,dest,a,se)输出pdf文件的等级,标题等参数

5、从官网下载软件,解压,并使用win+R cmd回车cd 文件路径python setup.py install

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。