大家好! 我尝试通过itext从PDF文件中获取一些带下划线的文本,对我来说似乎很难。我已经搜索了很长时间的解决方案,并且我已经学会了如何获取文本的字体,字体和文本位置。但是,没有强调。 期待您的帮助! 谢谢!
答案 0 :(得分:0)
使用itext可能无法实现,但是您可以使用pdfbox 在某种程度上
看看这个:https://stackoverflow.com/a/40039407/4353762
但是当心在某些情况下可能不起作用,库需要知道字体和字体描述符。如果您抛出类型未知的pdf,则描述符将返回null,并且代码将简单地以NullPointerException中断。
如果要手动处理NullPointerException,则可能需要查看以下方法的下划线和 strikeThrough 方法 PDFStyledTextStripper.java