在R中进行一些文本数据清理时,我可以找到一些特殊字符。为了摆脱它们,我必须知道它们的unicodes,例如€是\ u20AC。我想知道是否可以“看到”具有将特殊字符中的字符串作为输入考虑的函数的unicodes?
答案 0 :(得分:0)
special_char <- "%"
Unicode::as.u_char(utf8ToInt(special_char))
答案 1 :(得分:0)
请参阅Cath注释,iconv
可以完成此工作:
iconv("é", toRaw = TRUE)
然后,您可能需要unlist
并粘贴\u00
。