Question

尝试使用以下代码提取pdf的文本内容：

PdfReader reader = new PdfReader(path);
string strText = string.Empty;

for (int page = 1; page <= reader.NumberOfPages; page++)
{
    string s = PdfTextExtractor.GetTextFromPage(reader, page);
    strText += " " + s;                
}
reader.Close();

NumberOfPages返回257，但在第227页，GetTextFromPage（）抛出IndexOutOfRangeException。

感谢任何帮助。

hofnarwillie

Answer 1

我通过将我的iTextSharp版本从5.1升级到5.2来解决了这个问题。

iTextSharp v5 GetTextFromPage（）抛出IndexOutOfRangeException

1 个答案: