PDFbox - 获取行或文本字体大小/格式

时间:2013-07-09 11:08:43

标签: java pdfbox

我正在尝试从pdf文件中获取特定文本或行的字体大小或格式(粗体等),但直到现在都没有任何成功。

使用如下所示的PDFTextStripper只能获得纯文本

  

PDFTextStripper stripper = new PDFTextStripper();   String actualText = stripper.getText(actualDoc);

请你帮帮我吗? 谢谢。

1 个答案:

答案 0 :(得分:0)

您需要延长PDFTextStripper并覆盖PDFTextStripper#processTextPosition。通过此方法,您可以访问保存字体属性的TextPosition对象。 然后,您需要收集位于指定框(您的行)中的所有TextPosition并将它们放在一起。