如何从asp.net中的文件夹中读取多个pdf文件。

时间:2017-07-07 06:26:05

标签: c# asp.net pdf

我正在研究一个项目,我需要从文件夹中读取多个pdf文件,并在点击按钮时显示其内容。 我一次面临读取多个文件的问题。我怎么能读取多个pdf文件。有人帮帮我。?

protected void btnShowContent_Click(object sender, EventArgs e)
            { 
                //if (fileUpload.HasFile)
                //{

                    foreach (string file in Directory.GetFiles(@"E:\\Rida\","*.pdf"))
                    {
                    string str = "";
                    str = str + ", " + file.ToString();
                    PdfReader reader = new PdfReader(file);
                        string strPDFFile = file.ToString().Trim();
                        StringBuilder strPdfContent = new StringBuilder();
                    string pdfText = strPdfContent.ToString();
                        string contents = File.ReadAllText(strPDFFile);

                        for (int i = 1; i <= reader.NumberOfPages; i++)
                        {
                            ITextExtractionStrategy objExtractStrategy = new SimpleTextExtractionStrategy();
                            string strLineText = PdfTextExtractor.GetTextFromPage(reader, i, objExtractStrategy);
                            strLineText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(strLineText)));
                            strPdfContent.Append(strLineText);
                            strPdfContent.Append(contents);

                            strPdfContent.Append("<br/>");
                        }
                    reader.Close();
                    lblPdfContent.Text = strPdfContent.ToString();
                    }             
            }

此行将我的pdf文件内容转换为特殊字符。我该怎么做才能避免这种转变。?

string contents = File.ReadAllText(strPDFFile);

1 个答案:

答案 0 :(得分:0)

据我所知,.NET环境中的PDF解析和操作,您可以使用iTextSharp,它是一个PDF库,允许您以PDF格式创建,适应,检查和维护文档。 使用库,它可以帮助您解决问题!

https://sourceforge.net/projects/itextsharp/

http://jadn.co.uk/w/ReadPdfUsingCsharp.htm