根据字节r替换字符

时间:2018-03-23 10:47:40

标签: stringr stringi

我有国家的载体(x),其中一个国家是科特迪瓦

x< - c(“c \ u00f4te”,“côte”) 我调查x我意识到两个cote都不一样

  

showNonASCII(x)的   1:cte   2:cte   iconv(x,to =“ASCII // TRANSLIT”)   [1]“cA?te”“cote”   编码(X)   [1]“UTF-8”“latin1”

我想统一到这两个x都是latin1并且彼此相等。

1 个答案:

答案 0 :(得分:0)

在Mac-OS(R 3.5.0 MacOS High Sierra v 10.13.6)中使用时,似乎不会出现此问题。

x <- c("c\u00f4te", "côte")

# check if both are equal
x[1] == x[2]

[1] TRUE

# try to extract the word, if they are different only one should be returned
library(stringr)
str_extract_all(x, "côte")

[[1]]
[1] "côte"

[[2]]
[1] "côte"

该问题可能与Windows中使用的不同编码系统有关。