集体分类和半监督学习之间的区别是什么

时间:2016-03-04 09:03:33

标签: machine-learning classification

我遇到了标题之类的麻烦: 集体分类的定义是"集体分类是机器学习中的一个领域,其中网络中的未知节点基于分配给已知节点和网络结构的类别进行分类。" 半监督学习是为给定的未标记数据推断出正确的标签--- wiki

因此,它们之间唯一的区别是cc具有分类而ssl不具有分类。这是对的吗?

1 个答案:

答案 0 :(得分:1)

半监督学习更为通用 - 它没有指定/规定输入数据的结构。它可以概括为"从标记和未标记数据点的组合中学习"。执行推理的方法也未指定。

"集体分类"如上所述 指定推断未标记点的方式:

  

基于分配给已知节点和网络的类   只有结构。

因此,他们对数据有了额外的期望 - 以图形结构表示 - 它们的相关性可以用来计算它们的相对相似性,从而计算出它们的类别

本文https://www.cs.uic.edu/~xkong/sdm11_icml.pdf的集体分类摘要有助于说明对数据结构和语义的(更高)期望:

  

关系数据中的集体分类已经变得非常重要   在过去十年中积极的研究课题,其中一个类标签   一组链接的实例是相关的,需要预测   同时。

关于适用问题的类型的说明也很明显 - 请注意它们是面向图形的数据分析任务:

  

集体分类有各种各样的真实   世界应用,例如,过度链接的文件分类,   社交网络分析和协作网络分析