使用项目集的标题遍历关联规则

时间:2019-02-27 07:59:51

标签: python pandas dataframe data-mining apriori

我有一个像这样的输入数据框

enter image description here

我使用熊猫生成关联规则

SELECT CASE 
         WHEN n = 1 THEN LEFT(column1, Charindex(' ', column1) - 1) 
         WHEN n = 2 THEN RIGHT(column1, Charindex(' ', Reverse(column1)) - 1) 
       END AS column1, 
       CASE 
         WHEN n = 1 THEN LEFT(column2, Charindex(' ', column2) - 1) 
         WHEN n = 2 THEN RIGHT(column2, Charindex(' ', Reverse(column2)) - 1) 
       END AS column2 
FROM   tblsampledata t1 
       CROSS JOIN ( VALUES(1),(2) )t(n) 

我的输出仅生成每个项目集的规则值,而不标记标题。如下图所示。我的问题是 1-我想用其标题名称(年龄,AL,性别等)来标记前项和后项,因为我无法区分所有输出数字。示例:

frequent_itemsets = apriori(df, min_support=0.2, use_colnames=True)
rules = association_rules(frequent_itemsets, metric= "confidence", min_threshold = 0.6 )

2-如果我有以前的规则,并且想对输出中的所有规则进行迭代以进行一些计算,那么鉴于输出中的信息,我该怎么做

enter image description here

0 个答案:

没有答案