在数据帧中阻塞单词时出错

时间:2017-03-02 16:53:39

标签: r stemming

我创建了一个函数stemm_DF,它将一个新的colmumn添加到一个数据框中(该数据框包含一个名为words的colmun)。

数据框的结构是:

 word         positive.polarity       negative.polarity 
1 interesting                 1                 0                          
2      boring                 0                 1  

stemm_DF的功能如下:

require(SnowballC)
stemm_DF <- function(sentiment_DF){
  sentiment_DF["stem"] <- NA # That creates the new column named "stem" filled with "NA"
  text <- sentiment_DF["word"]
  sentiment_DF$stem <- wordStem(text, language = 'en')
  return (sentiment_DF)
}

我的问题是,当我运行r代码时,我得到了这个数据帧:

> stemm_DF(sentiment_DF)
         word positive.polarity negative.polarity       stem
1 interesting                 1                 0 c(2, 1, 3)
2      boring                 0                 1 c(2, 1, 3)
3      pretty                 1                 0 c(2, 1, 3)

我不知道乳清是否在茎柱中得到了这些c(2,1,3)。

我希望有这样的结果:

         word positive.polarity negative.polarity       stem
1 interesting                 1                 0 interest
2      boring                 0                 1 bore
3      pretty                 1                 0 pretty
你能帮帮我吗?

0 个答案:

没有答案