我正在研究一个项目,我需要从文件夹中读取多个pdf文件,并在点击按钮时显示其内容。 我一次面临读取多个文件的问题。我怎么能读取多个pdf文件。有人帮帮我。?
protected void btnShowContent_Click(object sender, EventArgs e)
{
//if (fileUpload.HasFile)
//{
foreach (string file in Directory.GetFiles(@"E:\\Rida\","*.pdf"))
{
string str = "";
str = str + ", " + file.ToString();
PdfReader reader = new PdfReader(file);
string strPDFFile = file.ToString().Trim();
StringBuilder strPdfContent = new StringBuilder();
string pdfText = strPdfContent.ToString();
string contents = File.ReadAllText(strPDFFile);
for (int i = 1; i <= reader.NumberOfPages; i++)
{
ITextExtractionStrategy objExtractStrategy = new SimpleTextExtractionStrategy();
string strLineText = PdfTextExtractor.GetTextFromPage(reader, i, objExtractStrategy);
strLineText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(strLineText)));
strPdfContent.Append(strLineText);
strPdfContent.Append(contents);
strPdfContent.Append("<br/>");
}
reader.Close();
lblPdfContent.Text = strPdfContent.ToString();
}
}
此行将我的pdf文件内容转换为特殊字符。我该怎么做才能避免这种转变。?
string contents = File.ReadAllText(strPDFFile);
答案 0 :(得分:0)
据我所知,.NET环境中的PDF解析和操作,您可以使用iTextSharp,它是一个PDF库,允许您以PDF格式创建,适应,检查和维护文档。 使用库,它可以帮助您解决问题!