计算字符列中的唯一字符串

时间:2017-10-12 13:56:05

标签: r text count strsplit

我有一个包含字符串观察的列,我需要计算该列中的唯一单词。例如,

enter image description here

我希望我的最终输出看起来像这样 -

enter image description here

列中的单词使用空格分开,因此这是我的另一个挑战。

由于

1 个答案:

答案 0 :(得分:1)

这是一个解决方案。

# the data
dat <- data.frame(X = c("Program Manager", "Program Coordinator",
                        "Senior Manager", "Senior Associate",
                        "Senior Researcher"),
                  stringsAsFactors = FALSE)

# count words  
table(unlist(strsplit(dat$X, " +")))

结果:

  Associate Coordinator     Manager     Program  Researcher      Senior 
          1           1           2           2           1           3 

使用as.data.frame,结果可以转换为数据框。

tab <- table(unlist(strsplit(dat$X, " +")))
as.data.frame(tab)

结果:

         Var1 Freq
1   Associate    1
2 Coordinator    1
3     Manager    2
4     Program    2
5  Researcher    1
6      Senior    3