使用itextsharp从PDF中读取文本而不更改格式

时间:2013-12-24 07:29:10

标签: c# pdf formatting itextsharp

您好我一直在尝试使用itextsharp将PDF文件的内容读入C#.net中的字符串,其格式与文件中的格式相同。

我的输入是一个PDF文件,其内容如

 hi, how are you?         I hope you are fine.
        how is everything            else?

我想以相同的格式阅读内容(我不希望它读取超过特定数量的空格作为换行符)...

但我得到它

 hi, how are you?         
 I hope you are fine.
 how is everything            
 else?

为此,我使用简单的代码

PdfReader reader = new PdfReader("c:\\Sample.pdf");    
string pdftext = PdfTextExtractor.GetTextFromPage(reader, 1,new SimpleTextExtractionStrategy());
            Console.WriteLine(pdftext);

你可以帮帮我吗。

0 个答案:

没有答案