在数据框中识别和替换“\\ xe2 \\ u0080 \\ x94”的问题

时间:2013-01-05 05:03:17

标签: r

我使用xlsx包将excel文件读入数据框y。虽然我的excel文件的某些单元格包含字符“ - ”,但当它们被读入R时,它们将变为“\ xe2 \ u0080 \ x94”。我想用NA或其他字符替换这些字符串。但是,我甚至无法在数据框中找到它们。

any(y=="\\xe2\\u0080\\x94")
[1] FALSE

如何找到它们并替换它们?

1 个答案:

答案 0 :(得分:1)

这有用吗:

x <- data.frame(y=c(1,2,3,"\\xe2\\u0080\\x94")) 
x
                  y
1                 1
2                 2
3                 3
4 \\xe2\\u0080\\x94

x$y[ x$y %in% "\\xe2\\u0080\\x94" ] <- NA
x
     y
1    1
2    2
3    3
4 <NA>

但我认为你应该提供一个建议的数据片段,因为它表明我无法重现错误,例如。

 library(xlsx)
 x <- read.xlsx("sillyexample.xlsx",1)

 > x
  y      z
1 a a2d-23
2 b      b
3 c      c