您好,我现在正在研究与R的关联规则。 我有一个问题。
在交易数据中, 我们考虑购买或不购买(二元数据)
我想知道如何使用计数数据执行关联规则
离)
item1 item2 item3
1 2 0 1
2 0 1 0
3 1 0 0
第一位顾客购买了两件商品!!
但在普通关联规则中,忽略该计数信息 我们怎样才能考虑这些信息?
答案 0 :(得分:0)
高,量化关联规则(QAR)挖掘可能会有所帮助。
首先,您应该将每个项目的值字段划分为一些集合,并为每个集合赋予唯一标签。然后,原始数据集可以转换为包含这些标签的二进制数据集。
例如,对于item1,如果原始数据具有以下信息:
第一个人买了5件商品
第二个买了2个项目
第三个买了7个item1。
您可以将item1的值字段划分为[0,3,[3,6]和[6,9],并使用a1,a2和a3来表示它们,因此可以替换项目'item1'由3个其他项目组成,分别是a1,a2和a3,原始数据可以由以下内容替换。
第一个人买了一个a2。
第二个人买了一个a1。
第三个人买了一个a3。
对每个项目执行此工作后,原始数据集可以转换为二进制数据集。