如何为数据挖掘过程对数据进行分类?

时间:2013-11-23 11:05:00

标签: r apriori categorical-data

我正在使用apriori函数执行数据挖掘过程。此功能仅适用于分类数据,没有值,只有文本。我的数据集符合这些要求,因为我有五个分类变量,没有数值而只有文本(因此变量'sex'分为'female'和'male')

如果我现在尝试apriori()功能,我会收到以下错误:

apriori(data)

asMethod(object)中的错误:

  column(s) 1, 2, 3, 4, 5 not logical or a factor. Use as.factor or categorize first.

虽然我的数据看起来很明确,但R并不是这样。我如何使用as.factor函数来正确分类我的数据,以便apriori函数有效?

2 个答案:

答案 0 :(得分:5)

您可以将所有列转换为系数:

data <- sapply(data,as.factor)

答案 1 :(得分:1)

对我来说

data <- data.frame(sapply(data,as.factor)) rules<- apriori(data)

运作良好