我正在尝试从.CSV文件中的数据中挖掘频繁的项目集和关联规则。了解R中的arules包并决定使用它。
面对从CSV创建数据框的问题。
我的CSV文件基本上具有以下格式的数据:
Runnable
有人可以帮我创建数据帧,将其传递给arules库的apriori()或elact()函数吗?
谢谢!
答案 0 :(得分:1)
听起来您想要将csv文件中的数据导入transactions
对象。
df <- read.csv(text='transactionid,items
1,"milk,beer,diapers"
2,"coke,milk,eggs"
3,"diapers,eggs,coke"',
stringsAsFactors=FALSE)
library(arules)
lst <- lapply(df$items,function(x)strsplit(x,split=",")[[1]])
names(lst) <- df$transactionid
trans <- as(lst,"transactions")
inspect(trans)
# items transactionID
# 1 {beer,
# diapers,
# milk} 1
# 2 {coke,
# eggs,
# milk} 2
# 3 {coke,
# diapers,
# eggs} 3
您还应该查看read.transactions(...)
函数。