我需要用扫描文档中的手写签名提取框。
我的PDF看起来像这样:Link to Dropbox
人们会下载此内容,签名,然后将其上传回给我。如何提取该签名框的内部? (如果需要,我可以修改PDF,添加一些边框,条形码,无论什么都有帮助。)
我尝试过各种各样的图像怪物。我可以得到估计的坐标,如下所示:
convert -crop 350x75+180+300 mock.pdf mock.png
它让我接近,但不准确(人们扫描不同)。但现在我有这个提取的签名:
现在我仍然不知道如何进入盒子并只裁剪那部分。我尝试了一些修剪和模糊,甚至是多重,但没有真正的结果。
我尝试过的一些例子:
convert -fuzz 10% -bordercolor black -border 2x2 -trim +repage
convert -trim
convert -trim +repage
multicrop -f 10% -b black -border 1x1 -trim + repage
multicrop -f 10% -b white -border 1x1 -trim + repage
我只需要修剪边框周围的白色,但不能达到像素。
我甚至尝试使用tesseract找到单词SIGN HERE,并提取坐标,并从中近似坐标 - 但我仍然遇到同样的问题,如何只获取框内部。
我还能尝试什么?
我可以在shell文件中管道多个转换命令,没问题。可以提取背景(可能类似于白色,取决于扫描),没有问题 - 事实上,这是期望的效果,最终使其透明,但不想让这成为问题的一部分,如果它会使事情变得复杂。
我所能尝试的任何例子都受到高度赞赏。
答案 0 :(得分:2)
假设您周围有实际的黑匣子,这可能与How can I detect boxes in an image and pull them out as individual files?
重复