正则表达式检查文本内容

时间:2019-02-20 09:52:58

标签: r regex

如何检查变量是否在R中的文本下方?如果var具有相同的文本且带有任意数字,则if条件应返回true。

"Warning: Map Join MAPJOIN[33][bigTable=?] in task 'Stage-3:MAPRED' is a cross product"

下面的文本可以是任何数字。

[33] and Stage-3

我知道我需要使用正则表达式,但是我对regex还是很陌生。

下面是示例代码。不管文本中的数字是多少,它都应返回true。

 var == "Warning: Map Join MAPJOIN[][bigTable=?] in task 'Stage-:MAPRED' is a cross product"
 var2== "Warning: Map Join MAPJOIN[11][bigTable=?] in task 'Stage-13:MAPRED' is a cross product"
 var3== "Warning: Map Join MAPJOIN[100][bigTable=?] in task 'Stage-123:MAPRED' is a cross product"
 var4== "Warning: Map Join MAPJOIN[11][bigTable=?] in task 'Stage-13:MAPRED' is a cross product-Textadded"
            if (var== var2){return TRUE} #Should return true
            if (var== var3){return TRUE} #Should return true
            if (var== var4){return TRUE} #Should NOT return true

2 个答案:

答案 0 :(得分:0)

您是否正在寻找类似的东西?

grepl("\\[\\d+\\].*Stage-\\d+", string)
#[1] TRUE

这会查找方括号[]中的任何数字,后跟Stage-和任何数字。

数据

string <- "Warning: Map Join MAPJOIN[33][bigTable=?] in task 'Stage-3:MAPRED' is a cross product"

答案 1 :(得分:0)

var="Warning: Map Join MAPJOIN[10][bigTable=?] in task 'Stage-12:MAPRED' is a cross product"
var2="Warning: Map Join MAPJOIN[33][bigTable=?] in task 'Stage-3:MAPRED' is a cross product"
if (gsub("[0-9]","",var)==gsub("[0-9]","",var2) ){
  print(TRUE)
}
TRUE

使用gsub将所有数字更改为零,然后进行比较。