R-计算字符串中的连续字母

时间:2019-06-26 21:19:09

标签: r

我想知道一个字符串中最大连续字母数的长度(不包括顺序)。例如:

ashjklmghipo

这里我们有连续的字母:jklm,ghi,po。最大连续字母为jklm。长度是4。

我对连续的数字做了同样的事情,但是不知道如何对字母进行此操作。 任何帮助将不胜感激。 TIA:)

2 个答案:

答案 0 :(得分:2)

将其简化为您已经解决的问题:

x = "ashjklmghipo"
x_letters = strsplit(x, "")[[1]]
x_digits = match(x_letters, letters)
x_digits
# [1]  1 19  8 10 11 12 13  7  8  9 16 15

否,您不需要在x_digits中找到最大的连续数字,即您已经知道该怎么做。 (如果您需要帮助,请see this question。)

答案 1 :(得分:0)

我当时正在考虑如何使用某些矩阵运算符,但是我只能通过递归策略来解决它。

我希望它会有用:
OBS:R有一个名为letters

的全局变量
#Get string
x = "ashjklmghipo"

#split in char
l = strsplit(x, "")[[1]]
# sort if you want
# l = sort(l)

# Creating data.frame with inital letter: 'init' and number of consecutives: 'n'
nleters = data.frame(init = l, n = 0)

# Using recursive strategi
kmax = length(l)

for(k in 1:kmax){
  # var letters is sorted in alphabet order
  aux = (letters[letters >= l[k]] == l[k:kmax])
  for(i in 1:length(aux)){
    # test if 
    if(aux[i]){
      nleters[k,"n"] = nleters[k,"n"] + 1
      # in first non consecutive "aplhabet" breaks inner loop
    }else{break()}
  }
}

# print result
nleters[order(-nleters$n),]