在使用iTextSharp时,我只能从少数PDF中读取文本而不是每个PDF。我正在使用LocationTextExtractionStrategy

时间:2015-05-06 11:04:59

标签: c# .net pdf itextsharp itext

我提供了矩形的坐标,它包含了我必须阅读文本的区域。我正在计算坐标,假设它是一个72 PPI的PDF文件。出于某种原因,我只能阅读使用microsoft word创建的PDF文本并且大小为3.5 MB。我无法从使用ghostscript创建的文件中读取文本,并且大小约为1 MB,即使两者的页面数量相同。我认为我在获取真实坐标时遇到问题,我使用GIMP计算坐标,并且在执行此操作时我必须设置PDF的PPI。你能告诉我我能做些什么吗?

0 个答案:

没有答案