标签: r character-encoding
我收到的一些数据包含一些俄语字符,并已转换为某些编码,如
<U+041D>
是否有将这些转换回UTF-8的功能,以便它们能够再次正确显示字符?
答案 0 :(得分:1)
尝试
as.character(parse(text = shQuote(gsub("<U\\+([A-Z0-9]+)>", "\\\\u\\1", "Bl<U+041D>")))) # [1] "BlН"