修改现有正则表达式以包含一些特殊字符

时间:2016-01-19 13:59:44

标签: regex r dataframe

我有一个列('branch')我正在执行数据清理,基本上我只想保留字母数字和一些特殊字符,如“ - ”,“/”,“(”,“)”,空间

目前这是我的代码(仅保留字母数字):

  library (stringr)

  df$branch1 <- str_replace_all(new_nodup$branch, "[\\W]", "")

我厌倦了使用以下内容,但这不起作用:

Regex to accept alphanumeric and some special character in Javascript?

1 个答案:

答案 0 :(得分:1)

您可以将要保留的字符包含在否定字符类中:

"[^\\w/()-]"

如果您还需要保留空格,请使用

"[^\\w\\s/()-]"

示例代码:

df$branch1 <- str_replace_all(new_nodup$branch, "[^\\w\\s()/-]", "")