用于为字符串中的digrams类型赋值的函数

时间:2017-09-19 11:17:38

标签: r regex string

我想编写一个函数,根据属于不同类的字符的交替为字符串赋值。

我定义了3种类:

digits <- "[^0-9]"
alphabetical <- "[^a-zA-Z]"
punctuation <- "[^[:punct:]]"

我希望功能:

  • 从左到右扫描字符串
  • 如果两个连续的字符属于不同的类,则赋值1,否则为0,在结尾处执行求和。
  • 字符串越多,值越高。

例如,对于:

123d4ss

我希望函数分配值&#39; 3&#39;,因为有序字符首先从数字切换到字母,然后从字母到数字再从数字切换到字母再次。

1 个答案:

答案 0 :(得分:1)

以下正则表达式定义了三种类型的组:数字,字母和标点符号。 如果我们计算这些组的出现次数,那么它就是你想要的数字加上一个。

" OR "