Java 提取/读取PDF中的图片
1、方法1:通过官网下载(https://www.e-iceblue.cn/Introduce/Free-Spire-PDF-JAVA.html)。下载包-解压,复制文件夹lib中的jar文件(如下图);在程序中新建一个directory目录,并命名,同时将jar文件复制到此目录下;选中复制后的jar文件,点击鼠标右键,选择“Add as Library”。完成引用。
2、方法2:通过maven导入。参考导入方法(https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html)
1、import com.spire.pdf.*;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
public class ExtractImg {
public static void main(String[] args) throws Exception{
//加载测试文档
PdfDocument pdf = new PdfDocument();
pdf.loadFromFile("test.pdf");
//定义一个int型变量
int index = 0;
//遍历PDF每一页
for (int i= 0;i< pdf.getPages().getCount(); i ++){
//获取PDF页面
PdfPageBase page = pdf.getPages().get(i);
//使用extractImages方法获取指定页上图片
for (BufferedImage image : page.extractImages()) {
//指定输出图片名称
File output = new File( String.format("Image_%d.png", index++));
//将图片保存为PNG格式
ImageIO.write(image, "PNG", output);
}
}
}
}
2、运行程序,提取图片。jar文件导入及图片提取效果如下图所示: