我正在使用 iTextSharp 来阅读pdf文件。我使用简单的文本提取策略使用pdfreader.GetPageContent()
和PdfTextExtractor.GetTextFromPage()
方法。
这两种方法都没有阅读所有的PDF格式。
对于一个pdf如果我使用GetTextFromPage
它抛出的索引超出了数组异常的范围(该页面有子弹标记和特殊字符)。
如何解决这个问题?
答案 0 :(得分:0)
最近修复了一些错误,因此您有两种选择:
如果您在构建最新的SVN后仍然遇到问题,请在sourceforge提交错误报告或订阅mailing list并在那里发布。
最近的错误修复可能会也可能不会解决您的具体问题。人们一直在抱怨解析器,但许多人不愿意提交重现问题的样本PDF。 换句话说,如果修复程序无法解决您的问题,并且您不愿意提交错误报告和示例PDF,那么您就不幸了。