从R中的字符串中提取子字符串

时间:2017-07-25 04:38:57

标签: r regex string

我有一个数据框,其中包含一个包含此Live by Night | Buy or rent on Blu-ray, DVD or digital字符串的列。我想只在|符号之前保留字符串。所以我想从上面得到的子串结果是“Live by Night” 提前感谢您的宝贵意见。

1 个答案:

答案 0 :(得分:3)

一个选项sub匹配零个或多个空格(\\s*)后跟|(元字符,因此我们需要转义以将其作为文字字符读取,否则它是适用于OR)后跟其他字符(.*)并将其替换为空白(""

sub("\\s*\\|.*", "", str1)
#[1] "Live by Night"

数据

str1 <-  "Live by Night | Buy or rent on Blu-ray, DVD or digital"