我创建了一个函数stemm_DF
,它将一个新的colmumn添加到一个数据框中(该数据框包含一个名为words的colmun)。
数据框的结构是:
word positive.polarity negative.polarity
1 interesting 1 0
2 boring 0 1
stemm_DF的功能如下:
require(SnowballC)
stemm_DF <- function(sentiment_DF){
sentiment_DF["stem"] <- NA # That creates the new column named "stem" filled with "NA"
text <- sentiment_DF["word"]
sentiment_DF$stem <- wordStem(text, language = 'en')
return (sentiment_DF)
}
我的问题是,当我运行r代码时,我得到了这个数据帧:
> stemm_DF(sentiment_DF)
word positive.polarity negative.polarity stem
1 interesting 1 0 c(2, 1, 3)
2 boring 0 1 c(2, 1, 3)
3 pretty 1 0 c(2, 1, 3)
我不知道乳清是否在茎柱中得到了这些c(2,1,3)。
我希望有这样的结果:
word positive.polarity negative.polarity stem
1 interesting 1 0 interest
2 boring 0 1 bore
3 pretty 1 0 pretty
你能帮帮我吗?