为什么关联规则学习被认为是一种有监督的学习方法?

时间:2017-04-23 10:34:03

标签: machine-learning classification data-mining

有人可以向我解释为什么关联规则学习被认为是一种有监督的学习方法?我理解它的方式是算法采用一堆连贯的数据集并根据这些集计算关联:

{a, b, c}
{a, b, d}
=> a -> b
=> b -> a

我看到它的方式,只有任意数据集。没有特定的目标载体。为什么这被称为监督?

1 个答案:

答案 0 :(得分:2)

如果将Association rule learning视为unsupervisedsupervised learning task,我认为这是一次公开讨论。虽然Wikipedia将其计入监督学习算法组other resources,但将其计入无监督学习算法类:

  

与决策树和规则集归纳相反,导致   分类模型,关联规则学习是无人监督的   学习方法,没有为示例分配类标签。

     

机器学习和数据挖掘 - Springer

我认为这取决于实际学习部分的实施方式。可以创建training data - label对的数据集,例如在您的示例中:

{a, b, c}
{a, b, d}
=> a -> b
=> b -> a

有几百或几千个这样的对可以训练神经网络以正确的方式理解数据集中的基本模式,正如我想的那样。这将是Supervised Learning task,其中NN从预先确定的示例中学习。

另一方面,如果以这样的方式实现算法,即基于以下方式计算关联:支持 - 置信度 - 提升 - 定罪它将是Unsupervised Learning task