如何从iText7中的pdfpage获取TextRenderInfo

时间:2017-05-03 17:58:26

标签: itext7

如何使用 iText 7 从pdf页面获取TextRenderInfo。我需要查找是否存在文本并导出该pdf页面的y坐标。有什么建议吗?

使用..

的任何选项
ITextExtractionStrategy textStrategy = new SimpleTextExtractionStrategy();
ITextExtractionStrategy locationStrategy = new LocationTextExtractionStrategy();

1 个答案:

答案 0 :(得分:2)

易, 实现ITextExtractionStrategy(或扩展现有的实现)。 界面有以下方法

@Override
public void eventOccurred(IEventData data, EventType type) {

     // you can first check the type of the event
     if (!type.equals(EventType.RENDER_TEXT))
        return;

     // now it is safe to cast
     TextRenderInfo renderInfo = (TextRenderInfo) data;
}

完成此类实施后,您需要使用

MyCustomStrategy strategy = new MyCustomStrategy(); // this is the class I described earlier
PdfTextExtractor.getTextFromPage(doc.getPage(pageNr), strategy);

然后可以简单地对您的自定义ITextExtractionStrategy进行编程以存储所有TextRenderInfo对象。并提供一个简单的吸气剂。