如何从PDF文件中获取带下划线的文本?

时间:2016-07-12 16:29:45

标签: pdf itext underline

大家好! 我尝试通过itext从PDF文件中获取一些带下划线的文本,对我来说似乎很难。我已经搜索了很长时间的解决方案,并且我已经学会了如何获取文本的字体,字体和文本位置。但是,没有强调。 期待您的帮助! 谢谢!

1 个答案:

答案 0 :(得分:0)

使用itext可能无法实现,但是您可以使用pdfbox 在某种程度上

看看这个:https://stackoverflow.com/a/40039407/4353762

但是当心在某些情况下可能不起作用,库需要知道字体和字体描述符。如果您抛出类型未知的pdf,则描述符将返回null,并且代码将简单地以NullPointerException中断。

如果要手动处理NullPointerException,则可能需要查看以下方法的下划线 strikeThrough 方法 PDFStyledTextStripper.java