应用错误收集

我使用 ImageMagick 预处理收据图片，然后再使用 tesseract-OCR 引擎提取文字。我使用

删除了图像中的噪点

convert input.png -colorspace gray \
  \( +clone -blur 0x2 \) +swap -compose divide -composite \
  -linear-stretch 5%x0%   photocopy.png

现在，我需要用文本裁剪出该区域。 ImageMagick具有遮罩功能，可以从图像中删除边框，但在我的情况下，由于收据图像的背景不均匀，创建遮罩似乎不起作用。

我已经通过SWT＆＃39; Stroke Width Transform＆＃39;识别自然图像中的文本＆＃39;来自here这可以通过imagemagick（可能是其他方便的开发人员图像处理工具）来识别文本，以便可以省略边框吗？提前谢谢。