是否可以使用apache poi从microsoft word文档获取标题的内容

时间:2018-03-05 20:10:27

标签: ms-word apache-poi

我可以使用方法getText()和段落内容使用getParagraphs()获取整个word文档的内容。但我希望根据标题提取内容。

这是一个示例文件。

标题 这是样本标题 - 第1段。这是样本标题 - 第2段。这是样本标题 - 第2段。 这是样本标题 - 第2段。这是样本标题 - 第2段。

背景: 这是样本标题 - 第2段

经验: 这是样本标题 - 第3段

标题,背景和经验是标题。

是否可以使用apache poi或任何其他API获取标题内容?

以下是代码:

FileInputStream fis = new FileInputStream("Test1.docx");
XWPFDocument xdoc = new XWPFDocument(OPCPackage.open(fis));
XWPFStyles styles = xdoc.getStyles();
List<XWPFParagraph> paragraphs = xdoc.getParagraphs();
        for (int i = 0; i < paragraphs.size(); i++) {

    if (paragraphs.get(i).getStyleID() != null) {
        String styleid = paragraphs.get(i).getStyleID();

        System.out.println("Paragraph Heading: " +paragraphs.get(i).getText());

        XWPFStyle style = styles.getStyle(styleid);

        if (style != null) {
            if (style.getName().startsWith("heading")) {
            System.out.println("Heading-Style is :" +style.getName());  
            }
        }
    }
}

我所期待的是将段落的标题标题为&#34; Title&#34;

0 个答案:

没有答案