Question

我正在实现一个功能，我在其中扫描输入pdfs的右下角并提取出现的文本。我有大约100个pdf，其中有2160 * 3024个维度（裁剪框）。我使用以下代码：

问题在于，在某些情况下，此代码开始返回位于pdf左上角的文本。我检查了页面的旋转和这些代码工作的pdf有90的旋转和不工作的情况有旋转270.所以，我写了代码将页面的旋转更改为90.但即使更改后旋转，它仍然在左上角而不是右下角给出文本。我可以使用以下代码获得带有270个旋转的pdf的右下角文本：

Rectangle pagesize = reader.GetCropBox(1);
Rectangle rect = new Rectangle((float)(0.903 * pagesize.Width), (float)(0.91 * pagesize.Height), pagesize.Width, pagesize.Height);

ITextExtractionStrategy strategy;
RenderFilter[] filter = { new RegionTextRenderFilter(rect) };
strategy = new FilteredTextRenderListener(new LocationTextExtractionStrategy(), filter);
string capturedText = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);

ITextSharp使用不同的X＆amp;不同pdf文件的Y轴方向？

0 个答案: