我正在实现一个功能,我在其中扫描输入pdfs的右下角并提取出现的文本。我有大约100个pdf,其中有2160 * 3024个维度(裁剪框)。我使用以下代码:
a
问题在于,在某些情况下,此代码开始返回位于pdf左上角的文本。我检查了页面的旋转和这些代码工作的pdf有90的旋转和不工作的情况有旋转270.所以,我写了代码将页面的旋转更改为90.但即使更改后旋转,它仍然在左上角而不是右下角给出文本。 我可以使用以下代码获得带有270个旋转的pdf的右下角文本:
Rectangle pagesize = reader.GetCropBox(1);
Rectangle rect = new Rectangle((float)(0.903 * pagesize.Width), (float)(0.91 * pagesize.Height), pagesize.Width, pagesize.Height);
ITextExtractionStrategy strategy;
RenderFilter[] filter = { new RegionTextRenderFilter(rect) };
strategy = new FilteredTextRenderListener(new LocationTextExtractionStrategy(), filter);
string capturedText = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);