我正在尝试使用r中的tm包进行文本分析。我在Windows系统上。
我创建了一个简单的函数来将复数名词转换为单一格式。请参阅附件中的代码。
to_single<-function(x){
if(str_sub(x,-3)=="ies"){
str_sub(x,-3)<-"y"}
else if(str_sub(x,-2)=="es"){
str_sub(x,-2)<-""
}
else if(str_sub(x,-1)=="s"){
str_sub(x,-1)<-""}
else{
x=x}
return(x)
}
然后我尝试使用content_transformer和tm_map函数来清理创建的语料库。
to_Single <- content_transformer(to_single)
docs <- tm_map(docs, to_Single)
#docs is the corpus I created.
然而,这不起作用。谁能让我知道我哪里错了?
非常感谢您的帮助。