如何使用单个单词替换数据框列中的多个单词?

时间:2015-01-18 22:16:57

标签: r gsub substitution stringr

我正在尝试清理一个数据库,其中的因素被用不同的词语估算,但意思相同。

Ex:来自“用尾巴,4条腿和毛皮扼杀猫”“欧洲虎斑猫”“猫猫猫” “Cat”

我查看了gsub类型的命令和stringr命令,但无法实现我的目标。

有什么建议吗?

编辑: 很抱歉不清楚,这是我的第一篇文章。

我想用一个单词替换几个单词。如果“cat”出现在条目中的任何位置,我希望将整个条目重命名为“Cat”。到目前为止,我只能用其他东西替换条目的某些部分,但不能删除多余的单词。

1 个答案:

答案 0 :(得分:2)

试试这个

x <- c("Purring cat with tail, 4 legs and fur", "European tabby cat", 
"dog", "Cat CAT cat", "bird")

replace(x, grepl("(?i)cat", x, perl=TRUE), "Cat")
# [1] "Cat"  "Cat"  "dog"  "Cat"  "bird"