单词权重的来源?

时间:2011-08-17 14:35:55

标签: search lexical-analysis

我正在构建一个非常基本的结果排名算法,我想要的一个方法是确定哪些单词在给定短语中通常更重要。它不一定非常精确,只是一般。

显然在4个字母下面删除任何单词,识别名称。但是,我还能用其他方法选出一个句子中最重要的3个单词?

1 个答案:

答案 0 :(得分:0)

在没有任何其他信息的情况下,可以假设重要的单词是罕见的单词。计算每个单词在您的文档集中出现的次数。计数最低的单词更重要,而计数最高的单词则不那么重要(如果不是几乎无用的话)。

相关阅读: