应用错误收集

你没有。 PDF没有样式。他们有“当前的图形状态”，其中包括：

首先，你必须跟踪所有这些东西（iText主要为你做的）。然后你必须确定“H1”文本的大小，并锁定所有大小屏幕大小的文本，考虑CTM，文本矩阵和字体大小（iText将再次为你做这些，IIRC ）。

只是为了让像你这样的人生活更加精彩，你所看到的文字完全有可能根本不是文字。它可能是路径，也可能是位图......此时你需要OCR，我认为你不会对OCR的尺寸信息有太大影响。

你需要写一个TextRenderListener来确定给定文本的最终大小（以及它是否是最后一篇文章的一部分）并过滤掉所有太小的东西。然后，您将根据找到的文本构建TOC。