我有一个数据列表,我希望在其中找到关联。我找到了使用 -
的频繁项目集frequent_itemsets = apriori(df, min_support=0.01, use_colnames=True)
将频繁项目集设为 -
support itemsets
0 0.020438 [AUCKLAND]
1 0.015320 [Adelaide]
2 0.043066 [Auckland]
....
我需要找到信心。我使用了关联规则函数 -
aa = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.001)
但是我得到一张只有列名的空表。
答案 0 :(得分:0)
records = []
for i in range(0, 7501):
records.append([str(store_data.values[i,j]) for j in range(0, 20)])
association_rules = apriori(records, min_support=0.0045, min_confidence=0.2, min_lift=3, min_length=2)
我认为您的代码应该是这样的,如果关联规则适用于您的数据,则您不应传递quently_itemsets,因为它单独为您的数据工作,而您应该使用附加名称,因为我在本案例中使用过记录。我希望你能有所想法。