R根据部分字符串匹配-管道

时间:2020-09-02 15:06:53

标签: r tidyverse

我有一个数据集,其中的列名是调查问题,范围很广,有时每个面板的标点符号都不同。因此,我想将部分字符串匹配的所有列标题重命名为更明智的var名称。

我当前的尝试是:

df %>%
  select_all(~str_replace(., "How would you describe your gender?", "cnt_gender"))

但是,这只会替换完全匹配的字符串,而不会保留其他任何字符串。例如:

Target string: "How would you describe your gender? (Select only one option)"

df %>%
  select_all(~str_replace(., "How would you describe your gender?", "cnt_gender"))

Desired output string: "cnt_gender"
Actual output string: "cnt_gender (Select only one option)"

我要寻找的是根据部分字符串匹配完全重命名列。

1 个答案:

答案 0 :(得分:1)

您可以在要替换的字符串后使用.*来捕获可能隐藏的其他所有内容(包括所有内容)。

Target_strings <- c("How would you describe your gender? (Select only one option)", 
                    "How would you describe your gender?")
str_replace(Target_strings, "How would you describe your gender?.*", "cnt_gender")
# [1] "cnt_gender" "cnt_gender"