我正在尝试清理一个数据库,其中的因素被用不同的词语估算,但意思相同。
Ex:来自“用尾巴,4条腿和毛皮扼杀猫”或“欧洲虎斑猫”或“猫猫猫” “Cat”。
我查看了gsub
类型的命令和stringr
命令,但无法实现我的目标。
有什么建议吗?
编辑: 很抱歉不清楚,这是我的第一篇文章。
我想用一个单词替换几个单词。如果“cat”出现在条目中的任何位置,我希望将整个条目重命名为“Cat”。到目前为止,我只能用其他东西替换条目的某些部分,但不能删除多余的单词。
答案 0 :(得分:2)
试试这个
x <- c("Purring cat with tail, 4 legs and fur", "European tabby cat",
"dog", "Cat CAT cat", "bird")
replace(x, grepl("(?i)cat", x, perl=TRUE), "Cat")
# [1] "Cat" "Cat" "dog" "Cat" "bird"