我可以使用方法getText()和段落内容使用getParagraphs()获取整个word文档的内容。但我希望根据标题提取内容。
这是一个示例文件。
标题 这是样本标题 - 第1段。这是样本标题 - 第2段。这是样本标题 - 第2段。 这是样本标题 - 第2段。这是样本标题 - 第2段。
背景: 这是样本标题 - 第2段
经验: 这是样本标题 - 第3段
标题,背景和经验是标题。
是否可以使用apache poi或任何其他API获取标题内容?
以下是代码:
FileInputStream fis = new FileInputStream("Test1.docx");
XWPFDocument xdoc = new XWPFDocument(OPCPackage.open(fis));
XWPFStyles styles = xdoc.getStyles();
List<XWPFParagraph> paragraphs = xdoc.getParagraphs();
for (int i = 0; i < paragraphs.size(); i++) {
if (paragraphs.get(i).getStyleID() != null) {
String styleid = paragraphs.get(i).getStyleID();
System.out.println("Paragraph Heading: " +paragraphs.get(i).getText());
XWPFStyle style = styles.getStyle(styleid);
if (style != null) {
if (style.getName().startsWith("heading")) {
System.out.println("Heading-Style is :" +style.getName());
}
}
}
}
我所期待的是将段落的标题标题为&#34; Title&#34;