如何使用 iText 7 从pdf页面获取TextRenderInfo。我需要查找是否存在文本并导出该pdf页面的y坐标。有什么建议吗?
使用..
的任何选项ITextExtractionStrategy textStrategy = new SimpleTextExtractionStrategy();
ITextExtractionStrategy locationStrategy = new LocationTextExtractionStrategy();
答案 0 :(得分:2)
易, 实现ITextExtractionStrategy(或扩展现有的实现)。 界面有以下方法
@Override
public void eventOccurred(IEventData data, EventType type) {
// you can first check the type of the event
if (!type.equals(EventType.RENDER_TEXT))
return;
// now it is safe to cast
TextRenderInfo renderInfo = (TextRenderInfo) data;
}
完成此类实施后,您需要使用
MyCustomStrategy strategy = new MyCustomStrategy(); // this is the class I described earlier
PdfTextExtractor.getTextFromPage(doc.getPage(pageNr), strategy);
然后可以简单地对您的自定义ITextExtractionStrategy进行编程以存储所有TextRenderInfo对象。并提供一个简单的吸气剂。