在doc / docx中查找生成的目录

时间:2017-09-08 12:22:10

标签: java apache-poi docx4j

我想查找包含生成索引的doc / docx文档中的所有页面,例如:目录,参考书目,表格/图片索引。

是否有可能在Java中实现这一目标?在docx4j / Apache POI中是否有任何此功能的工具?

1 个答案:

答案 0 :(得分:0)

docx4j包含用于生成和更新ToC的代码;见https://github.com/plutext/docx4j/tree/master/src/main/java/org/docx4j/toc和相应的样本。更新假定ToC在内容控件中(Word就是这样做的)。

至于找到ToC,有https://github.com/plutext/docx4j/blob/master/src/main/java/org/docx4j/toc/TocFinder.java

请注意,您需要一些二进制.doc文件的其他解决方案。

“参考书目,表/图片索引”没有特定内容,但您可以遍历docx来查找这些内容。