我想计算数据中文本中的单词数。
然后
我想使用循环来为数据中的每一行计算特定列“ Opinion”中的单词数。
有什么建议吗?
答案 0 :(得分:3)
我们可以使用str_count
中的stringr
library(stringr)
df1$nwords <- str_count(df1$Opinion, "\\w+")
或使用for
循环
df1$nwords <- NA_integer_
for(i in seq_along(df1$Opinion)) {
df1$nwords[i] <- length(strsplit(df1$Opinion[i], "\\s+")[[1]])
}
或在整列中使用strsplit
df1$nwords <- lengths(strsplit(df1$Opinion, "\\s+"))