从R中的部分向量中取出部分字符串

时间:2015-11-24 15:42:50

标签: r

我有这个问题整理数据。我有一个名为“对手”的矢量:

vs. wakeforest
Utah
vs. [9] Los Angelas
Seattle
vs. [11] UNC
at [19] North Carolina

我只想要对手的名字,即:

wakeforest
Utah
Los Angelas
Seattle
UNC
North Carolina

我应该如何清理它?非常感谢!

1 个答案:

答案 0 :(得分:3)

我们可以匹配字符,直到.]后跟一个或多个空格(\\s+)并将其替换为''

sub('^.*(\\.|\\])\\s+', '', opponent)
#[1] "wakeforest"     "Utah"           "Los Angelas"    "Seattle"       
#[5] "UNC"            "North Carolina"

数据

opponent <- c('vs. wakeforest', 'Utah',
'vs. [9] Los Angelas', 'Seattle',
'vs. [11] UNC','at [19] North Carolina')