Question

我需要裁剪图像以便仅获取页脚信息。有了这些信息，我得到了找到的文本的位置（使用pytesseract），但是只有页脚图像。因此，当我处理完整图像时，需要更新位置。现在，这里是我所拥有的：

裁剪图像：

from wand.image import Image as Img
from wand.color import Color

with Img(filename=img, resolution=300) as pic:
    pic.compression_quality = 100
    pic.background_color = Color("white")
    pic.alpha_channel = 'remove'
    heightRatio = int(pic.height / 3 + pic.height * 0.1)
    pic.crop(0, int(pic.height - heightRatio), pic.width, pic.height)
    pic.save(filename=jpgName)

在那之后，我的文字位置为{0: {x1,y1}, 1: {x2,y2}}，并且我有以下代码尝试获取该位置，例如我没有裁剪图像：

position[0][0] = line.position[0][0]
position[1][0] = line.position[1][0]
position[0][1] = line.position[0][1] + heightRatio 
position[1][1] = line.position[1][1] + heightRatio

但是当我在完整图像上显示位置时，它根本不适合。

有什么想法吗？

预先感谢

Answer 1

我终于找到了答案：裁剪功能是问题所在。使用此参数更好：

pic.crop(width=pic.width, height=int(pic.height - self.heightRatio), gravity='south')

裁剪图像页脚并获得原始位置

1 个答案: