我无法解决问题。我有每周在超市出售的产品价格数据。我的目标是通过时间比较商店中同质产品篮子的价格。
我知道产品并非一直都在所有商店中销售。但是我希望每个星期都有一套同类产品(这样我就可以在整个时间里比较一篮子产品),而且我想找到这些产品所在的商店。
我的数据如下:
Product Number - Store - Week - Price
70001 - 1 - 30 - 22.00
70002 - 2 - 30 - 4.50
70003 - 3 - 30 - 11.25
70003 - 1 - 31 - 12.50
70002 - 2 - 31 - 5.00
70001 - 3 - 31 - 22.50
请记住,我一年四季都有1000多种产品,并且有2000多家商店。总共大约有30Gb的数据。我试图避免使用循环。
我花了大约一周的时间尝试使用dplyr和聚合来完成此操作,但是我什么都没得到。