您好我一直在尝试使用itextsharp将PDF文件的内容读入C#.net中的字符串,其格式与文件中的格式相同。
我的输入是一个PDF文件,其内容如
hi, how are you? I hope you are fine.
how is everything else?
我想以相同的格式阅读内容(我不希望它读取超过特定数量的空格作为换行符)...
但我得到它
hi, how are you?
I hope you are fine.
how is everything
else?
为此,我使用简单的代码
PdfReader reader = new PdfReader("c:\\Sample.pdf");
string pdftext = PdfTextExtractor.GetTextFromPage(reader, 1,new SimpleTextExtractionStrategy());
Console.WriteLine(pdftext);
你可以帮帮我吗。