SAS在数据集中查找顶级组合

时间:2015-06-03 21:12:53

标签: sas

地狱大家 -

我有一些销售数据如下:

data have;
  input order_id item $;
cards;
1 A
1 B
2 A
2 C
3 B
4 A
4 B
;
run;

我想知道的是最受欢迎的商品组合是什么。例如,在上述情况中,有2个订单包含A& B项,1个A& C订单和1个B订单。什么是输出不同组合的最佳方式以及下达的订单数量?

2 个答案:

答案 0 :(得分:2)

似乎没有排列问题,你可以试试这个:

import os
import re
r = re.compile(r"|".join([e for e in exc]))
for f in os.listdir("path"):
    if f.endswith((".mp4",".mp3",".avi")):
        f = r.sub("",f)

答案 1 :(得分:1)

这个问题有很多可能的方法,我不会假设哪个是最好的。这是一个你可以使用的相当简单的方法:

  1. 转置您的数据,以便每个订单只有1行,每个产品都有一个指示变量。
  2. 将转置数据集输入proc corr以生成指标变量的相关矩阵,并寻找最强的相关性。