在R中同时替换同一字符串的多个子字符串

时间:2015-10-02 09:58:26

标签: r string substring special-characters str-replace

我希望将字符串向量中的拉丁字符替换为普通字符(例如é到e,á到a等)。我也希望为一个大型向量做这个,所以我将在循环中替换这些字符。我试图用下面的一个单词来做到这一点:

phrase <- "ÁÉÍÓÚ"
spec.elements <- c("[ÁÀÄÉÈËÍÌÏÓÒÖÚÙÜÑÇ]")

if (str_detect(phrase,spec.elements) == TRUE){
  str_replace(phrase, "Á", "A") & str_replace(phrase, "Ú", "U")
}

我收到以下错误:

Error in str_replace(phrase, "Á", "A") & str_replace(phrase, "Ú", "U") : 
  operations are possible only for numeric, logical or complex types

我也尝试了以下内容,输出显然不是合适的结果:

> str_replace(phrase, "[ÁÀÄÉÈËÍÌÏÓÒÖÚÙÜÑÇ]", "[AAAEEEIIIOOOUUUNC]")
[1] "[AAAEEEIIIOOOUUUNC]ÉÍÓÚ"

有人可以帮我将检测到的所有特殊字符替换为常规字符,而无需单独为每个特殊字符打开if语句吗?

2 个答案:

答案 0 :(得分:6)

我们可以使用chartr

if(grepl(spec.elements, phrase)){
 chartr('ÁÚ', 'AU', phrase)}
 #[1] "AÉÍÓU"

答案 1 :(得分:3)

也许chartr满足您的需求:

phrase <- c("ÁÉÍÓÚ", "ÚÓÍÉÁ")
spec.elements <- c("ÁÀÄÉÈËÍÌÏÓÒÖÚÙÜÑÇ")
spec.elements.rep <- c("AAAEEEIIIOOOUUUNC")
chartr(old=spec.elements, new=spec.elements.rep, x=phrase)
# [1] "AEIOU" "UOIEA"