如何使用Wordnet在R中进行词形还原?

时间:2013-02-18 17:51:29

标签: r wordnet lemmatization

我想在R中使用Wordnet的getLemma函数对语料库进行词形变换。但我不确定如何使用它。

以下是在R ..中使用wordnet包进行词形还原的文档。

filter <- getTermFilter("StartsWithFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter)
sapply(terms, getLemma) 

我的问题是我有一个包含5000个单词的文档,在这种情况下,我想将每个单词转换为其基本/根单词。例如:发烧 - &gt;发烧;发烧 - &gt;发烧

我想对语料库中的所有单词进行词形推理,并且不会将其限制为单词StartingWith ...,我也不理解terms <- getIndexTerms("NOUN", 5, filter)中数字5的重要性

如果有人能为我解决这个问题会很棒。

由于

1 个答案:

答案 0 :(得分:0)

5指的是maxLimit,它是你想要的最大结果数... http://cran.r-project.org/web/packages/wordnet/wordnet.pdf&lt; - 这就是您解决问题所需的一切