iTextSharp v5 GetTextFromPage()抛出IndexOutOfRangeException

时间:2011-12-20 16:39:41

标签: c# .net pdf itextsharp

尝试使用以下代码提取pdf的文本内容:

PdfReader reader = new PdfReader(path);
string strText = string.Empty;

for (int page = 1; page <= reader.NumberOfPages; page++)
{
    string s = PdfTextExtractor.GetTextFromPage(reader, page);
    strText += " " + s;                
}
reader.Close();

NumberOfPages返回257,但在第227页,GetTextFromPage()抛出IndexOutOfRangeException。

感谢任何帮助。

hofnarwillie

1 个答案:

答案 0 :(得分:1)

我通过将我的iTextSharp版本从5.1升级到5.2来解决了这个问题。