如何使用C#读取和标记(突出显示)pdf文件

时间:2014-02-18 10:24:20

标签: c# string pdf itext

我有一个pdf文件,我正在逐页阅读字符串。现在从第4页开始,我的pdf包含结算信息。这些结算信息在例如: - 一个是本地结算信息,另一个是标准结算根据我的要求,如果用户想要验证本地计费信息,我的代码应该读取所​​有本地计费数据并对其进行验证,以防任何数据(行)验证失败,它应该突出显示PDF文件的那一行。 / p>

这是我在C#中的代码

public static string ReadPdfFile(string fileName)
    {
        StringBuilder text = new StringBuilder();

        if (File.Exists(fileName))
        {
            PdfReader pdfReader = new PdfReader(fileName);

            for (int page = 2; page <= pdfReader.NumberOfPages; page++)
            {
                ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                text.Append(currentText);
            }
            pdfReader.Close();
        }
        return text.ToString();
    }
}

0 个答案:

没有答案