阅读论文,我很难理解所描述的算法:
给定手写样本的黑白数字图像,剪下一个字符进行分析。由于这可以是任何大小,算法需要考虑到这一点(如果它更容易,我们可以假设大小是2 ^ n x 2 ^ m)。
现在,描述说明了这个图像我们将它转换为512位特征(512位散列),如下所示:
(192位)通过将其与3x3 Sobel运算符进行卷积来计算图像的梯度。每个边缘的梯度方向被量化为12个方向。
(192位)结构要素生成器采用渐变映射并在邻域中查找梯度值的某些组合。 (用于计算表示图像中线条和角落的8个不同特征)
(128位)凹面生成器使用8点星形算子在4个方向,孔和滞后尺度笔划中找到粗凹度。
使用4x4网格对图像特征图进行标准化。
我现在正在努力学习如何拍摄任意图像,分成16个部分,并使用3x3 Sobel算子为每个部分提供12位。 (但如果您对其他部分有一些了解,请随时评论:)。
答案 0 :(得分:3)
斯里哈里等人正在努力研究同一篇论文。 (2002年)获得博士学位论文。我想说这篇文章不是很具体,但作者更多细节请参考技术报告(CEDAR-TR-01-1)。该报告似乎无法在互联网上访问,因此我的建议是通过电子邮件联系作者并要求提供此报告。如果问题不明确,您也可以要求澄清。
答案 1 :(得分:2)
我看到这个问题很老但也许它可以帮助某些人 - 你在图像上应用sobel算子进行水平和垂直边缘检测。从结果中,您可以计算图像每个点的图像方向向量。在您的情况下,您需要将这些向量映射到12个方向。然后,在您的情况下,您将图像划分为4x4子图像(16个部分)并计算每个部分中每个方向的强度。这为您提供了12 * 16 = 192个功能。如果需要,我可以提供更详细的解释。