我是stackoverflow和datascience的新手。现在我有一个项目,我想要执行关联规则分析。制作分析矩阵时遇到了一些麻烦。我的数据看起来像这样:
第1栏:收据编号,第2栏:品牌,第3栏:是否购买。
我想得到一个矩阵,其中收据号是行,而品牌是列。我要说的是并非每个收据都有所有品牌隐蔽。
答案 0 :(得分:0)
我认为答案就像创建表格一样简单。我将提供一个MWE:
data <- data.frame(receiptnumber = c('1', '1', '2', '3', '4'),
brand = c('A', 'A', 'B', 'C', 'D'))
print(data)
# receiptnumber brand
# 1 1 A
# 2 1 A
# 3 2 B
# 4 3 C
# 5 4 D
tabData <- table(data$receiptnumber, data$brand)
print(tabData)
# A B C D
# 1 2 0 0 0
# 2 0 1 0 0
# 3 0 0 1 0
# 4 0 0 0 1
正常索引仍然有效
tabData[1,3]
# 0