Java 获取PDF指定区域内的文本

2025-11-17 05:10:19

1、方法1:通过e-iceblue官网下载。下载后,解压文件,并将lib文件夹下的Spire.Pdf.jar文件导入到java程序。如下图:

Java 获取PDF指定区域内的文本

2、方法2:可通过maven仓库安装导入,配置路径及导入方法可参考链接里的步骤:https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html 。

3、测试文档如下,读取红色矩形框内的文本内容:

Java 获取PDF指定区域内的文本

1、import com.spire.pdf.*;


import java.awt.*;
import java.io.FileWriter;
import java.io.IOException;
public class GetText {
   public static void main(String[] args) {
       //加载PDF文档
       PdfDocument pdf = new PdfDocument();
       pdf.loadFromFile("sample.pdf");
       //获取第一页
       PdfPageBase page = pdf.getPages().get(0);
       //提取指定矩形区域的文本,写入到txt文档
       String text = page.extractText(new Rectangle(60, 60, 500, 100));
       StringBuilder sb = new StringBuilder();
       sb.append(text);

       FileWriter writer;


       try {
           writer = new FileWriter("GetSpecifiedText.txt");
           writer.write(sb.toString());
           writer.flush();
       } catch (IOException e) {
           e.printStackTrace();
       }
       pdf.dispose();
   }
}

2、文本读取结果:

Java 获取PDF指定区域内的文本

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢