我熟悉apriori算法,以及支持/置信/提升的含义。
我目前正在使用apyori apriori实现,我不确定我是否理解apyori.apriori()
来电的输出。
它就像这样
> RelationRecord(items=frozenset({'item1', 'item2'}),
> support=0.15365410803449842,
> ordered_statistics=[OrderedStatistic(items_base=frozenset({'item1'}),
> items_add=frozenset({'item2'}), confidence=0.6203420891875382,
> lift=2.2233410344037092),
> OrderedStatistic(items_base=frozenset({'item2'}),
> items_add=frozenset({'item1'}), confidence=0.5507049891540131,
> lift=2.2233410344037097)])
规则是什么?有多个支持/信心/提升,每个人都表示什么?
我很欣赏输出的每个部分的字典样式解释
答案 0 :(得分:6)
RelationRecord反映了项的子集,而ordered_statistics是OrderedStatistics的列表,它反映了规则。每个OrderedStatistics' items_base是前提,items_add是结果。支持存储在RelationRecord中,因为它对于包含的规则是相同的。
在你的例子中:
item1 - > item2的置信度为0.62,升力为2.2233410344037092x
第2项 - > item1的置信度为0.55,升力为2.2233410344037097x
两者都有支持= 0.15365410803449842。
为了它的价值,我最终转而使用PyFIM来获取相对功能丰富性和其他捆绑算法(例如fp-growth)。