我需要将pdf文件转换为excel。我试过用iTextSharp做到这一点。我能够使用iTextSharp提取线条,但问题是iTextSharp给我空格作为列分隔符,因此我无法在列分隔符空间和数据中的实际空格之间分叉。
e.g。我在pdf中有以下数据(列分隔:这里),
Col1:Col 2:Col 3:Col4
我明白了,
Col1 Col 2 Col 3 Col4
我需要得到类似的东西 Col1 {tab} Col 2 {tab} Col 3 {tab} Col4
任何解决方案? 我也对其他C#库而不是iTextSharp开放,最好是开源。
由于