标签: classification data-mining
我遇到了这个数据科学问题,想要了解其他人的意见。想象一下,您拥有Yelp用户数据集,其中包括他们的浏览历史记录,关键字等。还有一个基于二进制规则的分类器,可以将用户标记为素食者。但是,每个用户都没有标签来确定他们是否是素食者。所以问题是,我们如何评估基于规则的分类器?我的第一个想法是在数据集上使用聚类方法(例如K-mean)来了解数据及其集群。然后我们在群集上应用关联规则挖掘等技术,以了解不同群集在素食特征方面的表现。是否有意义?请让我知道你的想法。