潜在语义分析与词干

时间:2017-03-14 23:30:00

标签: nlp svd lemmatization lsa latent-semantic-analysis

假设任何一种语言都非常庞大。以下是否有意义?通过在这样的语料库上应用LSA,具有相似概念的词在向量空间中汇集在一起​​,因此对于相同概念的变形词形式理想地应该与它们在空间中的引理相同。有了这样的假设,查询或语料库的任何词形还原或词干都不是必需的。或者我完全错了?

1 个答案:

答案 0 :(得分:1)

根据LSA的创建者stemming is not necessary。不过,我认为在文学上对此存在普遍分歧。我读过几篇论文,发现在某些给定的信息检索任务中,词干可以改善结果。

通常,recent research显示词干对主题建模没有帮助,甚至可能损害主题的连贯性。