标签: python machine-learning classification cluster-analysis
如果我使用聚类(例如k表示聚类)作为KNN分类之前的数据预处理。这意味着我将集群用作监督式机器学习模型中的功能。我会得到更好的准确性吗?有人可以详细解释吗?非常感谢!
答案 0 :(得分:0)
是的,作为功能设计步骤,您可以使用群集。 (我认为)这是广泛使用的,尤其是在高维数据集中,使用直接强分类方法(例如支持向量机)在计算上非常昂贵。 有关更多详细信息,请参见this article。
我建议您在不使用聚类作为特征工程步骤的情况下建立基本模型,然后使用它进行比较。