我需要获取包含我的产品代码(即ABC CDE EFG)的数据集并在两个轴上创建一个矩阵,其中“inside”是一个二进制标志,表示我的数据集中出现了该组合。我已经找到了使用稀疏矩阵的类似解决方案,但该函数不适用于我的数据。 以下是我最终需要的一个例子。 IE ABC-ABC显然是1,因为它们是相同的产品,但是CDE-EFG表示当产品CDE与产品EFG同时购买时。我的问题是创建产品亲和度矩阵来分析这组交易数据的最佳方法是什么。
ABC CDE EFG GHI
ABC 1 0 0 0
CDE 0 1 1 0
EFG 1 1 1 0
GHI 0 0 0 1
编辑:我知道dplyr包及其亲和功能。但是,我的数据似乎无法成功运行。也许我需要从数据框中更改数据类型,但是我不确定这是否是问题。