识别并突出显示序列中的特定编码字符串

时间:2014-08-20 18:08:58

标签: r

是否有一种简单的方法可以突出显示或标记一列数据中的特定代码?

例如,在下面的列表中,对于包含“-R”的任何代码,我想突出显示此单元格以及包含相同“UK14.013 ##”但不包含“-R”的单元格

AP-12345  
AP-54321  
AP-89521  
AP-00012  
UK14.01303-RUSG2645942  
UK14.01303USG2634960  
UK14.01304-RUSG2645942  
UK14.01304USG2634960  
UK14.01317USG2636618  

感谢任何帮助,谢谢。

1 个答案:

答案 0 :(得分:0)

lines <- readLines(n=9)
AP-12345
AP-54321
AP-89521
AP-00012
UK14.01303-RUSG2645942
UK14.01303USG2634960
UK14.01304-RUSG2645942
UK14.01304USG2634960
UK14.01317USG2636618 

grep("UK14.013\\d{2}[^-R]", lines, value=TRUE)
#[1] "UK14.01303USG2634960"  "UK14.01304USG2634960"  "UK14.01317USG2636618 "

grep("-R", lines, value=TRUE)
#[1] "UK14.01303-RUSG2645942" "UK14.01304-RUSG2645942"

如果您只想索引

  grep("-R", lines)
  #[1] 5 7

 grep("UK14.013\\d{2}[^-R]", lines)
 #[1] 6 8 9