我是数据科学的新手,我对k-means(或任何)聚类算法有了更多的理论问题。此刻,我正在尝试根据行为数据进行客户细分。我们设计了几个属性,如: - 客户购买销售产品的百分比, - 每次平均产品数量 - 每件产品的平均价格 - 在商店购买产品的频率 - 和其他几个人。
我们要完成的是客户群,其行为类似于彼此,因此我们可以根据他们的偏好与他们沟通。问题在于,我不确定聚类的结果是否为我们提供了可以使用的正确细分。可能它会确定其他有利于可比性行为的集群,但不能用于实际应用。
我的问题如下;使用分类器算法会更好,所以我可以确定目标变量,还是应该使用聚类算法?如果我必须选择一个聚类算法,那么减少属性的数量会更好吗,这样我就可以更好地控制结果的方式了吗?
我希望你们能帮我解决这个概念问题。
答案 0 :(得分:0)
如果您可以使用分类,那么请始终使用分类。
群集很脆弱,不是一个定义明确的问题。您不希望在集群算法上构建业务。