Java 读取Word目录内容

2025-11-18 17:20:16

1、将Word库下载到本地,并解压,找到lib文件夹下的jar文件。然后在IDEA程序中打开“Project Structure”,执行如图步骤:

Java 读取Word目录内容

2、找到本地路径下的jar文件,点击“OK”,添加到列表:

Java 读取Word目录内容

3、勾选选项,点击“Apply”,然后等待程序安装导入jar:

Java 读取Word目录内容

4、完成jar导入后,编辑如下Java代码:

import com.spire.doc.Document;


import com.spire.doc.Section;
import com.spire.doc.documents.Paragraph;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
public class GetTOC {
   public static void main(String[] args) throws IOException {
       //加载包含目录的Word文档
       Document doc = new Document();
       doc.loadFromFile("目录2.docx");
       //获取第一节
       Section section = doc.getSections().get(0);
       //保存目录内容到.txt文档
       File file = new File("GetToc.txt");
       if (file.exists())
       {
           file.delete();
       }
       file.createNewFile();
       FileWriter fw = new FileWriter(file, true);
       BufferedWriter bw = new BufferedWriter(fw);
       //遍历第一节中的所有段落
       for (int i = 0; i < section.getParagraphs().getCount(); i++)
       {
           Paragraph paragraph = section.getParagraphs().get(i);
           //判断段落是否为目录
           if (paragraph.getStyleName().matches("TOC\\w+"))
           {
               //获取目录中的文本内容
               String text = paragraph.getText();
               //写入txt文档
               bw.write( text+"\r");
           }
           bw.write("\n");
       }
       bw.flush();
       bw.close();
       fw.close();
   }
}

5、执行代码,读取目录,生成txt文档,如图效果:

Java 读取Word目录内容

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢