应用错误收集

从Java中解析PDF文件的字体大小

时间：2012-10-25 14:12:43

标签： java parsing pdf font-size

我需要编写一个程序，可以找到PDF文档中的最大文本（可能是标题！），我尝试使用Tika作为解析器，但我找不到办法得到字体大小。此外，Tika库对我的使用来说似乎太强大和复杂。我可以使用更简单的方法/库吗？不使用库并自己解析PDF是否更容易或更好（我对这种方法感兴趣）？如果是的话，我应该从哪里开始？

非常感谢任何信息。

1 个答案:

答案 0 :(得分：1)

我在SO上发现this方法覆盖了PDFBox库中processTextPosition的{{1}}并提取字体大小。之前我没有看到它，因为帖子的问题有点不同。