我正在尝试apriori算法,这需要超过预期的时间,这是代码。
import pandas as pd
dataset = pd.read_csv("data.csv", header=None)
transactions = []
for i in range(0, 10):
temp = []
for j in range(0, 20):
temp.append(str(dataset.values[i,j]))
transactions.append(temp)
from apyori import apriori
associations = apriori(transactions, min_support=0.03, min_confidence=0.7, min_lift=3, min_length=2)
result = list(associations)
它正常工作到创建先验对象的程度。但是当我试图运行最后一行(转换为列表)时,它花了很多时间。
正如您在上面所看到的,我只输入了10个事务,但它输出的规则超过一百万,所以我无法在代码中找到错误。请帮助我找到问题。
下图显示了anaconda spyder ide中的变量值。
谢谢.....
答案 0 :(得分:0)
将min_support
更改为min_support=0.003
,将min_confidence
更改为min_confidence=0.2
如果问题仍未解决,请签出apriori.py
。