我正在做一个DIP项目。我想使用图像处理来计算每篇论文中的单词总数。
原始图片是:
我做了一些预处理并制作了以下图片:
我想计算每篇论文中的单词总数是为了检测blob中的数字。
所以请指导我。我该如何计算这张图片中的单词?你的想法是什么?
感谢。
答案 0 :(得分:1)
使用blobs / circle中的数字是一个很好的问题定义。我建议做一个圆形霍夫变换,只查找一定半径的圆,然后计算检测到的圆数。你必须弄清楚你的半径是多少像素,但这可能是一个很好的起点。祝你好运
答案 1 :(得分:1)
如果所有页面在某种程度上干净地分开,每行一个定义,您可以采用一种非常简单的方法来计算实线。首先检测页面上的列表以忽略不相关的标记(绿色框) - 只要边界不大于列表,就不必精确检测边缘。
然后查找没有标记的水平像素线,或者没有大于X暗度的暗值。下面用粉红色的水平线说明。最后计算实线(水平线的任何离散部分,非空),并且您有定义的数量。