我有以下图像(请参见下文),正在尝试对其进行预处理,以删除所有表单文本并保留手写输入。我正在使用PIL和OpenCV在python中进行所有预处理。可以使用哪些滤镜消除图像中的噪点?
答案 0 :(得分:1)
假定图像是BGR或灰度(不是二进制),并且用于填充文档的笔的颜色与打印的文本至少略有不同。 可能的唯一方法是将图像的颜色分为两个群集, 一类是笔的颜色,第二类是文字的颜色, 对于群集,您可以使用Kmeans k = 2的算法。
答案 1 :(得分:0)
使用ImageMagick,可以执行以下操作。您可能可以从基于ImageMagick的Python Wand中获得类似的功能。
复制图像。然后将其反转(取反)并使其模糊。然后阈值。然后将其放入输入的Alpha通道中。然后将其展平在白色背景上。
convert image.png -alpha off \
\( -clone 0 -negate -blur 0x2 -threshold 50% \) \
-alpha off -compose copy_opacity -composite \
-background white -compose over -flatten \
result.png