许多论文提到文本区域在图像被分成m×m矩阵块之后产生从灰度像素值计算的高特征值。此外,特征值是图像纹理“粗糙度”的度量。
这与获取文字有什么关系?文本区域通常有两种颜色,背景和前景,字母笔划均匀。这种粗糙度在哪里 - 可能有许多其他特征会更粗糙并触发高特征值。有人可以指出从哪里得到连接这些东西的数学?
编辑: 一些论文包括在自然场景中文本检测的背景下提到特征值。
A framework towards realtime detection and tracking of text在灰度图像上使用Eigentransform。
An eigenvalue-based approach to text detection in video提到从梯度图像的协方差矩阵计算特征值。
答案 0 :(得分:1)