我试图在Weka中应用Apriori算法 维基百科有一个简单的例子(Apriori algorithm):
alpha beta epsilon
alpha beta theta
alpha beta epsilon
alpha beta theta
可以从此表中确定以下关联规则:
alpha
的100%集合也包含beta
alpha
,beta的套装也有epsilon
alpha
,beta的套装也有theta
我将这些条目转换为CSV并添加了另一个属性行,因此我终于拥有了这个文件:
prod1,prod2,prod3
alpha,beta,epsilon
alpha,beta,theta
alpha,beta,epsilon
alpha,beta,theta
我将它加载到Weka并点击了标签" Associate",算法" Apriori"默认选择。
结果我得到以下内容:
1. prod2=beta 4 ==> prod1=alpha 4 conf:(1)
2. prod1=alpha 4 ==> prod2=beta 4 conf:(1)
3. prod3=epsilon 2 ==> prod1=alpha 2 conf:(1)
4. prod3=theta 2 ==> prod1=alpha 2 conf:(1)
5. prod3=epsilon 2 ==> prod2=beta 2 conf:(1)
6. prod3=theta 2 ==> prod2=beta 2 conf:(1)
7. prod2=beta prod3=epsilon 2 ==> prod1=alpha 2 conf:(1)
8. prod1=alpha prod3=epsilon 2 ==> prod2=beta 2 conf:(1)
9. prod3=epsilon 2 ==> prod1=alpha prod2=beta 2 conf:(1)
10. prod2=beta prod3=theta 2 ==> prod1=alpha 2 conf:(1)
但我也想要维基百科的例子中的频率(见上文)。