我在rstudio读取Linux系统上的中文文件时遇到了问题。
错误如下。
dt <- read.csv(file = "/home/..../aa-0912.csv", header = T , sep=",")
Error in make.names(col.names, unique = TRUE) :
invalid multibyte string at '<be><ba><b5><c3><c8><cb>'
此csv文件由具有指定编码的Window系统上的rstudio编写,如下所示:
write.csv(file = "/home/.../aa-0912.csv", data)
我可以在窗口上正确阅读,但是当我在Linux系统上复制此文件时,read.csv 不起作用。
Linux上的语言环境是:
Sys.getlocale()
[1] "LC_CTYPE=en_US.UTF-8;LC_NUMERIC=C;LC_TIME=en_US.UTF-8;LC_COLLATE=en_US.UTF-8;LC_MONETARY=en_US.UTF-8;LC_MESSAGES=en_US.UTF-8;LC_PAPER=en_US.UTF-8;LC_NAME=C;LC_ADDRESS=C;LC_TELEPHONE=C;LC_MEASUREMENT=en_US.UTF-8;LC_IDENTIFICATION=C"
The locale on Window is :
LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252
我正在尝试通过编码=“utf-8”读取数据,但我收到了类似的错误消息。
任何帮助?