R重音字符

时间:2012-11-24 00:37:51

标签: r

我正在使用R版本2.15.2(2012-10-26)与Win 7 x64上的RStudio版本0.97.168以及区域设置English_United Kingdom.1252。

我想使用'gsub'将'christiangrigć'替换为'christian grgi [ćc]'(后一个字符串稍后将用作正则表达式来查找名称的重音和非重音版本)

但是,R似乎并没有将ć视为重音c。这段代码

name <- "christian grgić"
gsub("ć","[cć]",name)

给出了这个输出

[1] "[cc]hristian grgi[cc]"

而不是我想要的:

[1] "christian grgi[cć]"

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:3)

试试这个:

Encoding(name) <- "UTF-8"
gsub("ć","[cć]",name)
#[1] "christian grgi[cć]"

请注意,这是我从sessionInfo()得到的本地信息:

> locale: [1]
> en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8