使用IText c#读取PDF文件时出错

时间:2018-04-05 09:45:50

标签: c# parsing itext

我正在使用iTextSharp.text.pdf阅读pdf文件。 但正如您在下面的代码中看到的那样,当我尝试阅读pdf的第一页时,它正在给我错误消息:“索引超出了数组的范围。

但是当我阅读第2页或第3页时,它没有给出错误信息。

以下是我用来阅读PDF文件的代码。

StringBuilder pdfContent = new StringBuilder();
PdfReader pdfReader = new PdfReader(pdfFilePath);
int pageCount = pdfReader.NumberOfPages;
for (int i = 1; i <= pageCount; i++)
    {
       ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
        string text = PdfTextExtractor.GetTextFromPage(pdfReader, i, strategy);
        if (!string.IsNullOrWhiteSpace(text))
        {
            pdfContent.Append(Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(text))));
        }

        if (parser != null)
        {
            parser.ProcessContent(i, imageRenderListener);
        }
    }
pdfReader.Close();

return pdfContent.ToString();

任何人都可以帮助我

0 个答案:

没有答案