尝试使用以下代码提取pdf的文本内容:
PdfReader reader = new PdfReader(path);
string strText = string.Empty;
for (int page = 1; page <= reader.NumberOfPages; page++)
{
string s = PdfTextExtractor.GetTextFromPage(reader, page);
strText += " " + s;
}
reader.Close();
NumberOfPages返回257,但在第227页,GetTextFromPage()抛出IndexOutOfRangeException。
感谢任何帮助。
hofnarwillie
答案 0 :(得分:1)
我通过将我的iTextSharp版本从5.1升级到5.2来解决了这个问题。