我有国家的载体(x),其中一个国家是科特迪瓦
x< - c(“c \ u00f4te”,“côte”) 我调查x我意识到两个cote都不一样
showNonASCII(x)的 1:cte 2:cte iconv(x,to =“ASCII // TRANSLIT”) [1]“cA?te”“cote” 编码(X) [1]“UTF-8”“latin1”
我想统一到这两个x都是latin1并且彼此相等。
答案 0 :(得分:0)
在Mac-OS(R 3.5.0 MacOS High Sierra v 10.13.6)中使用时,似乎不会出现此问题。
x <- c("c\u00f4te", "côte")
# check if both are equal
x[1] == x[2]
[1] TRUE
# try to extract the word, if they are different only one should be returned
library(stringr)
str_extract_all(x, "côte")
[[1]]
[1] "côte"
[[2]]
[1] "côte"
该问题可能与Windows中使用的不同编码系统有关。