对文档中的关键字进行排名

时间:2014-01-31 14:08:55

标签: ranking text-mining tf-idf

我要求在文档中对关键字进行排名。我只有1个文件,所以我不知道TF-IDF有多大帮助。我想根据关键字与文档的接近度和相关性对关键字进行排名, 我想知道我是否可以使用术语向量,如果是,如何?

由于

1 个答案:

答案 0 :(得分:0)

通常,要使用几个文档使用术语或术语获取几个文档之间的“邻近度”,您可以使用潜在语义空间---查找潜在文件语义分析here

但是,鉴于您只有1个文档,您不能这样做,因为您没有参考。这就像试图找出距感兴趣值的平均值有多少标准偏差,但您只有一个数字。解决此问题的一种方法是获取新数据,因此如果您的文档主题不是太模糊,那么您可以尝试从互联网上抓取这些信息。

如果这不是您想要的,也许您可​​能希望更具体地用您期望的结果解释问题,而不是您认为可能适用的方法。

干杯