我有一个pdf文件,我正在逐页阅读字符串。现在从第4页开始,我的pdf包含结算信息。这些结算信息在例如: - 一个是本地结算信息,另一个是标准结算根据我的要求,如果用户想要验证本地计费信息,我的代码应该读取所有本地计费数据并对其进行验证,以防任何数据(行)验证失败,它应该突出显示PDF文件的那一行。 / p>
这是我在C#中的代码
public static string ReadPdfFile(string fileName)
{
StringBuilder text = new StringBuilder();
if (File.Exists(fileName))
{
PdfReader pdfReader = new PdfReader(fileName);
for (int page = 2; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);
}
pdfReader.Close();
}
return text.ToString();
}
}