使用apache poi或docx4j基于页脚拆分docx

时间:2017-10-10 09:48:20

标签: java apache-poi docx4j

我有一个很大的docx文件,我想将它拆分为一个新的docx,其中只包含页脚,页面包含"附录B"在其中的单词,我可以有一些代码示例或任何帮助。

1 个答案:

答案 0 :(得分:1)

你可以有一个算法:

  1. 检查页脚,找出哪些包含感兴趣的单词。请注意指向此页脚的rels部分中的relId。
  2. 现在浏览主文档部分,查看sectPr元素。找到包含relId的sectPr元素。请注意,它可能是隐式的(与之前相同)。
  3. 如果您的页脚适用于相关部分中的每个页面,那么您可以删除之前和之后的内容,然后保存生成的docx。