我想查找包含生成索引的doc / docx文档中的所有页面,例如:目录,参考书目,表格/图片索引。
是否有可能在Java中实现这一目标?在docx4j / Apache POI中是否有任何此功能的工具?
答案 0 :(得分:0)
docx4j包含用于生成和更新ToC的代码;见https://github.com/plutext/docx4j/tree/master/src/main/java/org/docx4j/toc和相应的样本。更新假定ToC在内容控件中(Word就是这样做的)。
至于找到ToC,有https://github.com/plutext/docx4j/blob/master/src/main/java/org/docx4j/toc/TocFinder.java
请注意,您需要一些二进制.doc文件的其他解决方案。
“参考书目,表/图片索引”没有特定内容,但您可以遍历docx来查找这些内容。