ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Java 获取Word中的标题大纲(目录)

2021-04-13 16:05:13  阅读:199  来源: 互联网

标签:Word 大纲 text 标题 获取 paragraph bw Java


概述

Word中的标题可通过“样式”中的选项来快速设置(如图1),

图1

 

在添加目录时,可将“有效样式”设置为“目录级别”显示(如图2),一定程度上来说,标题大纲也可以作为目录来参考。

图2

本文,将通过后端Java程序代码介绍如何来获取Word中的标题内容。

注:如果在Word中进行了如图2中的设置,此方法也可以作为获取目录的方法;若没有对应设置,则想要通过此方法来获取的目录内容可能不完整。

 

本次测试的Word文档如下图所示,【标题样式】和【目录级别】经过相应设置,在获取标题大纲时等同于获取目录:

图3

代码测试环境

  • Word测试文档:.docx 2013版
  • 编译环境:IntelliJ IDEA 2018
  • Jdk版本:1.8.0
  • Word jar包:free spire.doc.jar 3.9.0

 

Java 程序代码

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;

import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;


public class GetTitle {
    public static void main(String[] args)throws IOException {
        //加载Word测试文档
        Document doc = new Document();
        doc.loadFromFile("sample.docx");

        //保存标题内容到.txt文档
        File file = new File("GetTitle.txt");
        if (file.exists())
        {
            file.delete();
        }
        file.createNewFile();
        FileWriter fw = new FileWriter(file, true);
        BufferedWriter bw = new BufferedWriter(fw);

        //遍历section
        for (int i = 0; i < doc.getSections().getCount(); i++)
        {
            Section section = doc.getSections().get(i);
            //遍历Paragraph
            for (int j = 0; j < section.getParagraphs().getCount(); j++)
            {
                Paragraph paragraph = section.getParagraphs().get(j);

                //获取标题
                if ( paragraph.getStyleName().matches("1"))//段落为“标题1”的内容
                {
                    //获取段落标题内容
                    String text = paragraph.getText();

                    //写入文本到txt文档
                    bw.write("标题1: "+ text + "\r");
               }
                //获取标题
                if ( paragraph.getStyleName().matches("2"))//段落为“标题2”的内容
                {
                    //获取段落标题内容
                    String text = paragraph.getText();

                    //写入文本到txt文档
                    bw.write("标题2: " + text + "\r");
                }
                //获取标题
                if ( paragraph.getStyleName().matches("3"))//段落为“标题3”的内容
                {
                    //获取段落标题内容
                    String text = paragraph.getText();

                    //写入文本到txt文档
                    bw.write("标题3: " + text+"\r");
                }
                //获取标题
                if ( paragraph.getStyleName().matches("4"))//段落为“标题4”的内容
                {
                    //获取段落标题内容
                    String text = paragraph.getText();

                    //写入文本到txt文档
                    bw.write("标题4: " + text+"\r");
                }

                bw.write("\n");
            }

        }
        bw.flush();
        bw.close();
        fw.close();
    }
}

标题(目录)获取结果:

 

本文完。

原创内容,如需转载,请注明出处!

 

标签:Word,大纲,text,标题,获取,paragraph,bw,Java
来源: https://www.cnblogs.com/Yesi/p/14653661.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有