即使对于少量数据,Apriori算法也会显示大量结果

时间:2018-04-04 17:24:53

标签: python machine-learning apriori

我正在尝试apriori算法,这需要超过预期的时间,这是代码。

import pandas as pd
dataset = pd.read_csv("data.csv", header=None)
transactions = []

for i in range(0, 10):
    temp = []
    for j in range(0, 20):
        temp.append(str(dataset.values[i,j]))
    transactions.append(temp)

from apyori import apriori
associations = apriori(transactions, min_support=0.03, min_confidence=0.7, min_lift=3, min_length=2)

result = list(associations)

它正常工作到创建先验对象的程度。但是当我试图运行最后一行(转换为列表)时,它花了很多时间。

正如您在上面所看到的,我只输入了10个事务,但它输出的规则超过一百万,所以我无法在代码中找到错误。请帮助我找到问题。

下图显示了anaconda spyder ide中的变量值。 enter image description here

谢谢.....

1 个答案:

答案 0 :(得分:0)

min_support更改为min_support=0.003,将min_confidence更改为min_confidence=0.2

如果问题仍未解决,请签出apriori.py