R中的字符编码变化

时间:2015-11-09 13:38:54

标签: r character-encoding

我收到的一些数据包含一些俄语字符,并已转换为某些编码,如

<U+041D>

是否有将这些转换回UTF-8的功能,以便它们能够再次正确显示字符?

1 个答案:

答案 0 :(得分:1)

尝试

as.character(parse(text = shQuote(gsub("<U\\+([A-Z0-9]+)>", "\\\\u\\1", "Bl<U+041D>"))))
# [1] "BlН"