如何用当前单词

时间:2017-08-17 11:45:26

标签: r text nlp lemmatization

用现有单词替换过去的单词时,我应该使用哪些命令?

得到,得到,(得到) - >获得

去,去(去) - >去

思想 - >认为

买 - >买

我想用这种方式用当前的单词替换它。

我很感激您对我的代码的建议。

library(tm)
library(XML)
crudeCorp<-VCorpus(VectorSource(readLines(file.choose())))
crudeCorp <- tm_map(crudeCorp, stripWhitespace) 

我知道以下命令会将过去的动词改为现在的形式。但是,在我输入此命令后,我查看了它。还有一句话。

crudeCorp <- tm_map(crudeCorp, stemDocument)

1 个答案:

答案 0 :(得分:0)

我认为你需要干预词语:

docs <- tm_map(crudeCorp , PlainTextDocument) 
    tm_map(docs, stemDocument, "english")