我使用xlsx
包将excel文件读入数据框y
。虽然我的excel文件的某些单元格包含字符“ - ”,但当它们被读入R时,它们将变为“\ xe2 \ u0080 \ x94”。我想用NA
或其他字符替换这些字符串。但是,我甚至无法在数据框中找到它们。
any(y=="\\xe2\\u0080\\x94")
[1] FALSE
如何找到它们并替换它们?
答案 0 :(得分:1)
这有用吗:
x <- data.frame(y=c(1,2,3,"\\xe2\\u0080\\x94"))
x
y
1 1
2 2
3 3
4 \\xe2\\u0080\\x94
x$y[ x$y %in% "\\xe2\\u0080\\x94" ] <- NA
x
y
1 1
2 2
3 3
4 <NA>
但我认为你应该提供一个建议的数据片段,因为它表明我无法重现错误,例如。
library(xlsx)
x <- read.xlsx("sillyexample.xlsx",1)
> x
y z
1 a a2d-23
2 b b
3 c c