我想在R中使用Wordnet的getLemma函数对语料库进行词形变换。但我不确定如何使用它。
以下是在R ..中使用wordnet包进行词形还原的文档。
filter <- getTermFilter("StartsWithFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter)
sapply(terms, getLemma)
我的问题是我有一个包含5000个单词的文档,在这种情况下,我想将每个单词转换为其基本/根单词。例如:发烧 - &gt;发烧;发烧 - &gt;发烧
我想对语料库中的所有单词进行词形推理,并且不会将其限制为单词StartingWith ...,我也不理解terms <- getIndexTerms("NOUN", 5, filter)
中数字5的重要性
如果有人能为我解决这个问题会很棒。
由于
答案 0 :(得分:0)
5指的是maxLimit,它是你想要的最大结果数... http://cran.r-project.org/web/packages/wordnet/wordnet.pdf&lt; - 这就是您解决问题所需的一切