我有一个数据集,我有很多项目,他们的销售数据是按周销售的数量和数量。我想弄清楚两者之间是否存在某种相关性,试图在任何正面或负面影响的情况下,如果一件物品的销售影响另一件的销售,那就试图获取。 请考虑以下类型的数据:
Week # Product # Sale($) Quantity
Week 1 Product 1 1 1
Product 2 2 1
Product 3 3 1
Week 2 Product 1 3 2
Product 3 2 1
Product 6 2 2
Week 3 Product 4 2 1
Product 3 1 2
Product 5 4 2
因此,从上周的上述数据来看,我想弄清楚如何将这些数据转换为一种市场购物篮数据形式,并提供上述参数。因为,没有任何市场篮子数据可用。
The parameters I could think of is :
To use the count or occurrences of each product in a given week.
To use the total quantity sold
To use the total sales to find correlation.
所以,基本上我必须想出一个项目如何与另一个产品与另一个产品的亲和力相关联。无论它是正相关还是负相关。唯一的问题是我没有任何主键来绑定一个篮子或订单号的物品,因为它卷起了销售。 本主题中的任何答案或帮助都非常值得一提。如果您发现它不完整,可以让我知道任何进一步的清晰度。
答案 0 :(得分:0)
您无法执行此操作,因为您没有关于共现的信息。您还有从每日谷物到每周谷物的数据混乱。聚合不允许这样做。