R-计算文本字符串变量中的单词数

时间:2020-05-02 19:16:26

标签: r dataframe for-loop while-loop

我想计算数据中文本中的单词数。

然后

我想使用循环来为数据中的每一行计算特定列“ Opinion”中的单词数。

有什么建议吗?

1 个答案:

答案 0 :(得分:3)

我们可以使用str_count中的stringr

library(stringr)
df1$nwords <- str_count(df1$Opinion, "\\w+")

或使用for循环

df1$nwords <- NA_integer_
for(i in seq_along(df1$Opinion)) {
      df1$nwords[i] <- length(strsplit(df1$Opinion[i], "\\s+")[[1]])
 }

或在整列中使用strsplit

df1$nwords <- lengths(strsplit(df1$Opinion, "\\s+"))