我有一个数据集,其中的列名是调查问题,范围很广,有时每个面板的标点符号都不同。因此,我想将部分字符串匹配的所有列标题重命名为更明智的var名称。
我当前的尝试是:
df %>%
select_all(~str_replace(., "How would you describe your gender?", "cnt_gender"))
但是,这只会替换完全匹配的字符串,而不会保留其他任何字符串。例如:
Target string: "How would you describe your gender? (Select only one option)"
df %>%
select_all(~str_replace(., "How would you describe your gender?", "cnt_gender"))
Desired output string: "cnt_gender"
Actual output string: "cnt_gender (Select only one option)"
我要寻找的是根据部分字符串匹配完全重命名列。
答案 0 :(得分:1)
您可以在要替换的字符串后使用.*
来捕获可能隐藏的其他所有内容(包括所有内容)。
Target_strings <- c("How would you describe your gender? (Select only one option)",
"How would you describe your gender?")
str_replace(Target_strings, "How would you describe your gender?.*", "cnt_gender")
# [1] "cnt_gender" "cnt_gender"