将未知数据集分类为已知类别

时间:2019-07-01 16:28:43

标签: python-3.x machine-learning scikit-learn

我有许多数据集,其中有段端点的x,y,z坐标数组。第一点和第二点代表一个线段,第三点,第四点等等……

x, y, z coordinates of points

以上数据仅代表数据集的一部分...整个数据集要大得多。

我需要用几个这样的数据集训练我的机器,以便它可以进一步预测任何未知数据集的类别...测试数据集也将与上面的相同。

我需要有关方法的帮助。我可以在此处使用哪种算法或方法将未知数据集分类为这些已知类别?

1 个答案:

答案 0 :(得分:1)

这是一个无监督的学习问题。如果您大致知道应将您的数据分为几类,请使用K-Means(https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

否则,TSNE(https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html)和Kmeans的组合通常效果很好。基本上使用TSNE转换数据,然后在转换后的数据中运行Kmeans。