如何使用itextsharp从PDF文件中提取水平线?

时间:2017-09-11 11:37:51

标签: c# pdf itext

pchip我正在使用iTextSharp从PDF文件中读取文本。我正在使用LocationTextExtractionStrategy类来实现此目的。我有一个特定的文档,其横向线横跨页面的整个宽度,位于页脚附近。此行用作正文文本和页脚内容之间的可视分区。

如何让iTextSharp读取这一行?

谢谢, 秀

1 个答案:

答案 0 :(得分:1)

基本思想是实现IEventListener,然后监听PathRenderInfo事​​件。只要解析器命中绘图指令,就会调用它们。

从PathRenderInfo中,您可以轻松提取正在绘制的线条。然后您可以简单地查找具有最低y值的行(因为原点通常位于页面的左下角)。

我在Java中有这个代码,但它应该与.net。

非常相似
=IFERROR(INDIRECT(ADDRESS(LARGE(((A2=A$2:A$11)+0)
*((ROW()>ROW(A$2:A$11))+0)*ROW(A$2:A$11),1),COLUMN($A2)+1)),"-")