TextRank算法可以归类为无监督机器学习吗?

时间:2017-05-28 20:32:01

标签: machine-learning nlp summarization

TextRank是一种自动文本摘要方法。许多人把它归类为"无人监督"做法。我想知道这是否转化为TextRank被归类为无监督机器学习技术。

2 个答案:

答案 0 :(得分:1)

TextRank与机器学习没有直接关系:Machine learning涉及创建数据模型以根据先前的观察预测未来的观察。这涉及调整模型参数以适合观察到的数据。

另一方面,TextRank是一种基于图表的排名算法:它根据单个文档的结构查找摘要部分,不使用观察来学习任何东西。由于它不是机器学习,它也不能成为无监督的机器学习。

答案 1 :(得分:0)

TextRank,Mihalcea和Tarau的原作者在某种意义上将他们的工作描述为unsupervised

  

特别是,我们为关键词和句子提取提出并评估了两种创新的无监督方法。

然而,这与unsupervised learning不同,即在未标记的数据中找到隐藏的结构。

此外,TextRank不是machine learning算法,换句话说,它不会通过“将损失函数与正则项或边约束最小化”来推广数据(per Stephen Boyd,et al )。语言学家可能没有一些相似之处,尽管这不属于这个问题的范围。

即便如此,一些混淆可能来自于TextRank和相关方法被用于开发特征向量以呈现给机器学习算法的事实。