我想计算多种模式,但包括*(任何字符)。
以下是一个示例搜索:Y*Y
,YY*
和X*X
同时
df <- data.frame(
V1 = c("A", "B", "C", "D"),
V2 = c("XXYYYYY", "XXYYXX" , "XYXXYX", "XYYXYX")
)
这是我的尝试:
library(stringr)
df$V3 <- str_count(df$V2, "Y+Y+")
df$V4 <- str_count(df$V2, "YY+")
df$V5 <- str_count(df$V2, "X+X+")
我不确定如何在字符串中指定随机字符以及如何一次计算两个或多个模式。
预期产出:
V1 V2 V3 V4 V5
A XXYYYYY 1 1 1
B XXYYXX 1 1 2
C XYXXYX 2 0 3
D XYYXYX 2 1 3