应用错误收集

我遇到了这个数据科学问题，想要了解其他人的意见。想象一下，您拥有Yelp用户数据集，其中包括他们的浏览历史记录，关键字等。还有一个基于二进制规则的分类器，可以将用户标记为素食者。但是，每个用户都没有标签来确定他们是否是素食者。所以问题是，我们如何评估基于规则的分类器？我的第一个想法是在数据集上使用聚类方法（例如K-mean）来了解数据及其集群。然后我们在群集上应用关联规则挖掘等技术，以了解不同群集在素食特征方面的表现。是否有意义？请让我知道你的想法。

在Yelp数据中查找素食用户

0 个答案: