地狱大家 -
我有一些销售数据如下:
data have;
input order_id item $;
cards;
1 A
1 B
2 A
2 C
3 B
4 A
4 B
;
run;
我想知道的是最受欢迎的商品组合是什么。例如,在上述情况中,有2个订单包含A& B项,1个A& C订单和1个B订单。什么是输出不同组合的最佳方式以及下达的订单数量?
答案 0 :(得分:2)
似乎没有排列问题,你可以试试这个:
import os
import re
r = re.compile(r"|".join([e for e in exc]))
for f in os.listdir("path"):
if f.endswith((".mp4",".mp3",".avi")):
f = r.sub("",f)
答案 1 :(得分:1)
这个问题有很多可能的方法,我不会假设哪个是最好的。这是一个你可以使用的相当简单的方法:
proc corr
以生成指标变量的相关矩阵,并寻找最强的相关性。