如何在文档图像中查找单词的查找质心?我尝试使用首先模糊每个单词,以便连接字符形成轮廓,然后使用该轮廓中的均值来找到质心。还有其他方法吗?
答案 0 :(得分:0)
模糊可能是一种好方法,但根据字体,您可以开始使用上面或下面一个字符串的单词模糊单词。您可以考虑另外两个级别的文本元素表示,以使您的方法更健壮。
您可以在处理中降低一级,并使用字母获得细分。可以使用MSER或连接的组件或Stroke Width Transform来查找字母。监控字母之间的距离将允许您将它们连接成单词。字母大小和单词之间的距离也可以让您更好地了解单词之间可能的距离。
您也可以更高级别(在处理层次结构中)并找到字符串。然后,您可以遍历一个字符串,该字符串使用字母像素表示垂直扫描线。直方图中的通道将指示字边界。字符串的高度也可以与单词之间的空白长度相称。最后,字符串作为一个整体似乎较少依赖于字体或大写字母与单词相比的特殊性。