如何使用Apriori算法获取将规则中的元素链接起来的方程式?

时间:2019-01-23 00:32:06

标签: python anaconda data-mining apriori

我有一个来自excel文件的数据库,其中包括75个项目,我想要获取根据74个元素的值计算第75个元素的方程。

我正在使用Anaconda和python来挖掘数据并通过Apriori算法获得规则,我得到了规则,但是它没有用,因为它是一个无法理解的公式,并且我有一个问题: *如何根据将规则转换为计算第75个元素的方程式  74个元素的值?

#Import libraries & dataset
import pandas as pd

from apyori import apriori

number_of_raws = 4000
number_of_columns = 75

store_data = pd.read_excel('C:\\Users\\smaol\\Aro\\1.xlsx',header=1)

#convert to list
transactions  = []

for i in range(0, number_of_raws):
    for j in range(0, number_of_columns):
        transactions.append(str(store_data.values[i,j]))

#found Rule
association_rules = apriori(transactions, min_support=0.025, min_confidence=0.5, min_lift=3, min_length=2)  
association_results = list(association_rules)  

结果:

[RelationRecord(items=frozenset({'a', 'n'}), support=0.043116666666666664, ordered_statistics=[OrderedStatistic(items_base=frozenset({'a'}), items_add=frozenset({'n'}), confidence=1.0, lift=23.192887514495556), OrderedStatistic(items_base=frozenset({'n'}), items_add=frozenset({'a'}), confidence=1.0, lift=23.192887514495556)])]
[RelationRecord(items=frozenset({'a', 'n'}), support=0.043116666666666664, ordered_statistics=[OrderedStatistic(items_base=frozenset({'a'}), items_add=frozenset({'n'}), confidence=1.0, lift=23.192887514495556), OrderedStatistic(items_base=frozenset({'n'}), items_add=frozenset({'a'}), confidence=1.0, lift=23.192887514495556)])]
[RelationRecord(items=frozenset({'a', 'n'}), support=0.043116666666666664, ordered_statistics=[OrderedStatistic(items_base=frozenset({'a'}), items_add=frozenset({'n'}), confidence=1.0, lift=23.192887514495556), OrderedStatistic(items_base=frozenset({'n'}), items_add=frozenset({'a'}), confidence=1.0, lift=23.192887514495556)])]
[RelationRecord(items=frozenset({'a', 'n'}), support=0.043116666666666664, ordered_statistics=[OrderedStatistic(items_base=frozenset({'a'}), items_add=frozenset({'n'}), confidence=1.0, lift=23.192887514495556), OrderedStatistic(items_base=frozenset({'n'}), items_add=frozenset({'a'}), confidence=1.0, lift=23.192887514495556)])]

enter image description here

enter image description here

1 个答案:

答案 0 :(得分:0)

如果您总是具有完全相同的行数,则最有可能不是“购物篮”数据。将其转换为项目集时,位置信息可能会丢失

使用标准预测算法怎么样?例如决策树和随机森林?

请勿使用“ apyrori”。这是一个错误的实现。