标签: c# pdf text itextsharp extraction
我使用iTextSharp使用C#阅读PDF文件。 使用PdfTextExtractor.GetTextFromPage()函数的文本提取将按预期返回所有文本。
iTextSharp
PdfTextExtractor.GetTextFromPage()
但是对于一个PDF,它说,内容,索引和说应该删除页码。 我只是想得到一段文字。
我通过浏览ITextExtractionStrategy来检查选项的可用性。
ITextExtractionStrategy
我真的很无能,任何指针都会有帮助。
我尝试使用AcroFields来隔离字段,但这看起来像是一个很长的镜头。
AcroFields
谢谢。
此致 〜MAYUR