计算论文中学习词汇的总数[图像处理]

时间:2015-05-22 20:36:39

标签: image-processing image-segmentation feature-detection feature-extraction object-detection

我正在做一个DIP项目。我想使用图像处理来计算每篇论文中的单词总数。

原始图片是:

Original image

我做了一些预处理并制作了以下图片: Pre-processed image

我想计算每篇论文中的单词总数是为了检测blob中的数字。

所以请指导我。我该如何计算这张图片中的单词?你的想法是什么?

感谢。

2 个答案:

答案 0 :(得分:1)

使用blobs / circle中的数字是一个很好的问题定义。我建议做一个圆形霍夫变换,只查找一定半径的圆,然后计算检测到的圆数。你必须弄清楚你的半径是多少像素,但这可能是一个很好的起点。祝你好运

答案 1 :(得分:1)

如果所有页面在某种程度上干净地分开,每行一个定义,您可以采用一种非常简单的方法来计算实线。首先检测页面上的列表以忽略不相关的标记(绿色框) - 只要边界不大于列表,就不必精确检测边缘。

然后查找没有标记的水平像素线,或者没有大于X暗度的暗值。下面用粉红色的水平线说明。最后计算实线(水平线的任何离散部分,非空),并且您有定义的数量。

enter image description here