pchip
我正在使用iTextSharp从PDF文件中读取文本。我正在使用LocationTextExtractionStrategy类来实现此目的。我有一个特定的文档,其横向线横跨页面的整个宽度,位于页脚附近。此行用作正文文本和页脚内容之间的可视分区。
如何让iTextSharp读取这一行?
谢谢, 秀
答案 0 :(得分:1)
基本思想是实现IEventListener,然后监听PathRenderInfo事件。只要解析器命中绘图指令,就会调用它们。
从PathRenderInfo中,您可以轻松提取正在绘制的线条。然后您可以简单地查找具有最低y值的行(因为原点通常位于页面的左下角)。
我在Java中有这个代码,但它应该与.net。
非常相似=IFERROR(INDIRECT(ADDRESS(LARGE(((A2=A$2:A$11)+0)
*((ROW()>ROW(A$2:A$11))+0)*ROW(A$2:A$11),1),COLUMN($A2)+1)),"-")