通过上传的图像检测垃圾邮件文本(过滤脚本)?

时间:2013-05-01 12:01:53

标签: image filtering ocr spam

我想知道是否有脚本或过滤工具能够识别在用户上传的图片中应用的垃圾邮件文本,如下所示:

IMAGE SPAM TEXT EXAMPLE

1 个答案:

答案 0 :(得分:0)

这是一个复杂的问题。简短的回答是否定的。很长的答案是,这个问题由几个不连续的动作组成,它们在组合和受控环境中可以为您提供所需的动作。

图像中的文本需要OCR或其他一些对象检测才能知道它是文本。根据图像,文本,文本背景和图案的颜色,该文本可能过于集成到图像本身,几乎就像验证码。

www.ocr-it.com网站上有一篇博客文章描述了OCR在图像被二值化之后如何在图像中找到文本。有时浅色背景上的浅色文字可能完全消失。 http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

如果在图像中检测到文本,那么可以很容易地过滤它。