如何通过R中句子中的行(单词)获取特定子串的频率?

时间:2017-06-17 20:49:58

标签: r

如果我有一个载体

x <- c("aa/bb","cc/aa","aa/dd", "bb/cc")

我想得到特定子串的输出,例如“aa”和“bb”:

aa = 3
bb = 2

无论位置如何,都可以计算出该频率。 请告诉我,我们是否有这个功能,或者我们需要编写一个单独的功能。

提前致谢。

1 个答案:

答案 0 :(得分:1)

您可以在for (smallArrayWithIndex <- bigArray.zipWithIndex.sliding(n)) { val startingIndex = smallArrayWithIndex.head.map { case (_, index) => index } val smallArray = smallArrayWithIndex.map { case (e, _) => e } println("smallArray starts at index " + index + " and contains " + smallArray) } 分割x并使用/计算频率。

table

如果你想计算特定的子串,你可以做

table(unlist(strsplit(x, "/")))

#aa bb cc dd 
# 3  2  2  1