image-processing - 计算论文中学习词汇的总数[图像处理]

时间：2015-05-22 20:36:39

标签： image-processing image-segmentation feature-detection feature-extraction object-detection

我正在做一个DIP项目。我想使用图像处理来计算每篇论文中的单词总数。

原始图片是：

Original image

我做了一些预处理并制作了以下图片： Pre-processed image

我想计算每篇论文中的单词总数是为了检测blob中的数字。

所以请指导我。我该如何计算这张图片中的单词？你的想法是什么？

感谢。

答案 0 :(得分：1)

使用blobs / circle中的数字是一个很好的问题定义。我建议做一个圆形霍夫变换，只查找一定半径的圆，然后计算检测到的圆数。你必须弄清楚你的半径是多少像素，但这可能是一个很好的起点。祝你好运

答案 1 :(得分：1)

如果所有页面在某种程度上干净地分开，每行一个定义，您可以采用一种非常简单的方法来计算实线。首先检测页面上的列表以忽略不相关的标记（绿色框） - 只要边界不大于列表，就不必精确检测边缘。

然后查找没有标记的水平像素线，或者没有大于X暗度的暗值。下面用粉红色的水平线说明。最后计算实线（水平线的任何离散部分，非空），并且您有定义的数量。

enter image description here