我有一个{A_i}->{X}
项目集列表。
像:
{A}->{X}
{A}->{Z}
{A,B}->{X}
{A,B}->{W}
现在我想合并项目集,如:
{A}->{X,Z}
{A,B}->{X,W}
但我不知道如何计算每条规则的支持,信心和提升 这是总和/计数还是所有类似项目集的最小值?
对于支持,所有类似集合的支持都是有意义的。但是信心和提升?
答案 0 :(得分:5)
我认为您正在引用关联规则。
对于关联规则X - > Y,规则的支持表示为sup(X-> Y),是出现XUY的交易数除以交易总数。
置信度是出现XUY的交易数除以X出现的交易数量。
升力定义为:升力(X - > Y)=((sup(X U Y)/ N)/(sup(X)/ N * sup(Y)/ N),其中 N是事务数据库中的事务数, sup(X∪Y)是包含X和Y的交易数量, sup(X)是包含X的事务数 sup(Y)是包含Y的交易数量。
有关提升计算的示例,您可以查看SPMF软件的示例23:
http://www.philippe-fournier-viger.com/spmf/index.php?link=documentation.php#lift