如何提取PDF文件中的文字
1、打开一份PDF文件,点击工具栏中的“转换”按钮。可以看到PDF文件的文字提取有两种方式:PDF转TXT、提取文字
2、方法一:按照转TXT文本进行操作。可提取全部或佛盲部分页面的文字,选择存储位置即可。
3、方法二:按照提取文字进行操作。会出现预段常览效果,从截图中可以看出,文章格式是蚂互距有变动的。
1、通过以上两种方法都可以实现在PDF中提取文字。但通过笔者的试验发现,两者的优缺点是:
同一个PDF文件使用转TXT的方式,能更有效、准确是实现文字提取,缺点是纯文本,需要重新排版。
而提取文字的方式会出现遗漏部分文字的现象。
因此建议使用第一种方式进行PDF中文字的提取。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:64
阅读量:94
阅读量:122
阅读量:147
阅读量:73