如何在R中将特殊字符转换为unicode?

时间:2016-06-08 13:01:47

标签: r character-encoding special-characters

在R中进行一些文本数据清理时,我可以找到一些特殊字符。为了摆脱它们,我必须知道它们的unicodes,例如€是\ u20AC。我想知道是否可以“看到”具有将特殊字符中的字符串作为输入考虑的函数的unicodes?

2 个答案:

答案 0 :(得分:0)

special_char <- "%"
Unicode::as.u_char(utf8ToInt(special_char))

答案 1 :(得分:0)

请参阅Cath注释,iconv可以完成此工作:

iconv("é", toRaw = TRUE)

然后,您可能需要unlist并粘贴\u00