标签: itextsharp
我正在使用iTextSharp Library来从PDF中提取所有文本。 它工作正常但在我从SAP收到的少量PDF文件中,所有粗体文本在提取的文本中返回两次。
以前有人遇到过这样的事吗?
我正在使用
PdfTextExtractor.GetTextFromPage(reader, p, new LocationTextExtractionStrategy())
并实施了自定义TextExtractionStrategy。
TextExtractionStrategy