我想创建一个应用程序,它可以学习对用户绘制的点序列进行分类,例如:手写识别之类的东西。如果数据点由多个(x,y)对组成(如对应于手势实例的像素),那么计算实例的最佳特征是什么,这将构成一个好的多类分类器(例如SVM, NN等)?特别是如果提供有限的培训示例。
答案 0 :(得分:1)
如果我是你,我会找到与角点,终点和交叉点对应的数据点,将它们用作特征并丢弃中间点。您也可以包括这些兴趣点的角度或其他描述符。
为了检测兴趣点,您可以使用Harris detector,然后可以将该点的梯度值用作简单描述符。或者,您可以采用更加精美的方法,例如SIFT。
您可以使用缩减采样图像中每个像素的描述符,然后使用SVM进行分类。其缺点是在特征向量中存在大量不感兴趣的数据点。
另一种方法是不将其作为分类问题,而是作为模板匹配问题(在computer-vision中相当常见)。在这种情况下,可以将手势指定为任意数量的兴趣点,完全省略非兴趣数据。实例点的某个阈值百分比必须与用于肯定标识的模板匹配。例如,当将'R'实例的角点与'X'的模板进行匹配时,右下角应匹配,即相同位置方向的端点,但其他点太不相似,相当低得分和识别R = X将被拒绝。