从Notebook

时间:2016-12-28 12:48:08

标签: python opencv ocr text-extraction

我正在尝试从图像中提取手写文本。我使用python和opencv函数,比如find_contours。当我使用像这样的图像时,一切都很顺利:

enter image description here

它工作正常,因为我有一个简单的背景。但后来我用这张图片测试了它:

enter image description here

由于背景中笔记本的线条,我无法仅提取文本。虽然文本是红色的,但我将所有图像转换为灰度或有时阈值,因此它们都像笔记本行一样变黑。这样,文本的颜色无关紧要。所以我的问题是:任何人都可以给我建议或解决方法如何处理这种背景以提取文本。我真的不想使用滑动窗口方法。 提前谢谢

1 个答案:

答案 0 :(得分:0)

我决定再次使用OpenCV中的HoughLinesP功能,这次给了我一个更有希望和令人满意的结果。这是我用来删除大部分行的代码的片段:

swarm-master

附加信息:thresh.png是我存储初始pic的阈值版本的图像。整个过程的工作方式是它找到图像中的线条并将它们涂成黑色(因为在我的阈值中,接近白色的线条变为黑色,反之亦然)。这就是它如何清除线条。

PS:希望我帮助过某个人!干杯!