如何使用imagemagick从PDF格式的框中裁剪签名?

时间:2013-12-30 21:11:52

标签: imagemagick

我需要用扫描文档中的手写签名提取框。

我的PDF看起来像这样:Link to Dropbox

人们会下载此内容,签名,然后将其上传回给我。如何提取该签名框的内部? (如果需要,我可以修改PDF,添加一些边框,条形码,无论什么都有帮助。)

我尝试过各种各样的图像怪物。我可以得到估计的坐标,如下所示:

convert -crop 350x75+180+300 mock.pdf mock.png

它让我接近,但不准确(人们扫描不同)。但现在我有这个提取的签名:

enter image description here

现在我仍然不知道如何进入盒子并只裁剪那部分。我尝试了一些修剪和模糊,甚至是多重,但没有真正的结果。

我尝试过的一些例子:

convert -fuzz 10% -bordercolor black -border 2x2 -trim +repage

convert -trim

convert -trim +repage

multicrop -f 10% -b black -border 1x1 -trim + repage

multicrop -f 10% -b white -border 1x1 -trim + repage

我只需要修剪边框周围的白色,但不能达到像素。

我甚至尝试使用tesseract找到单词SIGN HERE,并提取坐标,并从中近似坐标 - 但我仍然遇到同样的问题,如何只获取框内部。

我还能尝试什么?

我可以在shell文件中管道多个转换命令,没问题。可以提取背景(可能类似于白色,取决于扫描),没有问题 - 事实上,这是期望的效果,最终使其透明,但不想让这成为问题的一部分,如果它会使事情变得复杂。

我所能尝试的任何例子都受到高度赞赏。

1 个答案:

答案 0 :(得分:2)

假设您周围有实际的黑匣子,这可能与How can I detect boxes in an image and pull them out as individual files?

重复