我正在攻读我的机器学习(ML)课程,我有一个问题,就是根据我目前的知识找不到答案。假设我有以下数据集,
att1 att2 att3 class
5 6 10 a
2 1 5 b
47 8 4 c
4 9 8 a
4 5 6 b
上面的数据集很清楚,我想我可以在训练数据集后为新的输入数据应用分类算法。由于每个实例都有一个标签,因此很容易理解每个实例都有一个标有的类。现在,我的问题是如果我们有一个由不同实例组成的类,如手势识别数据。任何类都有多个指定其类的实例。例如,
xcor ycord depth
45 100 10
50 20 45
10 51 12
以上三个实例属于A类,以下三个实例属于B类作为一个组,我的意思是这三个数据实例一起构成该类。对于手势数据,手的移动坐标。
xcor ycord depth
45 100 10
50 20 45
10 51 12
现在,我想将每个传入的三个实例分组为A或B?是否可以将所有这些标记为A或B而不单独标记每个实例?例如,假设以下组属于B,所以我希望所有实例一起标记为B,因为它们与A类或B类独立相似?如果有可能,我们如何称呼它?
xcor ycord depth
45 10 10
5 20 87
10 51 44
答案 0 :(得分:2)
似乎你可能会对不同类型的机器学习感到困惑。
您班级中提供的数据集是 supervised分类算法的示例。也就是说,给定一些数据和一些类,学习一个可以预测新的,看不见的数据类的分类器。您可以应用于此问题的分类器包括
您要描述的第二个问题是 unsupervised分类问题的示例。也就是说,给定一些没有标签的数据,我们希望找到一种自动分离不同类型数据(您的A和B)的方法。解决此问题的算法包括
我会研究运行因子分析或规范化数据,然后运行K均值或高斯混合模型。如果数据可以区分,则应该发现A和B类型的数据。
答案 1 :(得分:2)
我没有看到您可能希望将数据集中不确定数量的行分组为给定类的功能的情况。它们要么与一个类独立关联,要么它们都是特征,因此是一个独特的行。类似的东西:
Instead of
xcor ycord depth
45 10 10
5 20 87
10 51 44
会是这样的:
xcor1 ycord1 depth1 xcor2 ycord2 depth2 xcor3 ycord3 depth3
45 10 10 5 20 87 10 51 44
这与用于建模时间序列的方法几乎相同
答案 2 :(得分:1)
查看neural networks for recognizing hand-written text的使用情况。您可以将手势视为带有附加时间成分的手写图形(因此,为每个像素指定一个“年龄”。)如果您的训练数据还包含相似的时间数据,那么我认为该技术应该可以很好地进行。 / p>