如何从合并文件生成目录“TOC”.TOC应该是每个页面的标题

时间:2017-07-18 05:14:39

标签: itext

如何从合并文件生成目录“TOC”.TOC应该是每个页面的标题。我看过很多例子,所有TOC示例都是基于页码编号。我使用的是文本pdf 5.5.11。 / p>

image

1 个答案:

答案 0 :(得分:2)

我会尝试以下工作流程:

  1. 提取您希望标题为
  2. 的文字
  3. 存储(字符串列表)所有标题及其相应页面
  4. 在列表上循环并展平它(例如[TitleA,TitleA,TitleB,..]应该变为[TitleA,TitleB])
  5. 现在您有关于第一次出现每个标题的信息
  6. 使用此信息构建TOC
  7. 如果您的文档被标记,这可以通过更频繁的方式完成(考虑到使用标题的大致位置并简单地提取文本,有一些启发式方法)