我的CSV中包含捷克字符,如下所示:
id,address,city
660999,Vršovická 10,Praha
676838,Valentova 50,Praha 4
676858,Husova 6740,Pardubice
677971,Lipová 10,Třebíč
678304,Jana Ziky 10/1955,Ostrava
...
当我导入到RStudio时,如果我使用View()函数查看它,一切看起来都很好。
但在终端,当我查看价值观时,一切看起来都很疯狂。
xl = read.csv("some_csv.csv")
head(xl)
id address city
1 660999 Vršovická 10 Praha
2 676838 Valentova 50 Praha 4
3 676858 Husova 6740 Pardubice
4 677971 Lipová 10 TÅ™ebÃÄ
5 678304 Jana Ziky 10/1955 Ostrava
当我使用Encoding(xl[1,2])
检查编码时,例如"unknown"
。
我也有俄罗斯数据同样的问题。
我已尝试切换到Sys.setlocale("LC_CTYPE", "czech")
和Sys.setlocale("LC_CTYPE", "russian")
并在这些设置下导入,但行为相同。
我在Windows 7上使用Rstudio版本0.98.501和R版本3.0.2。另一台计算机上的同事遇到了同样的问题。
我能做的任何事情都能使这些字符在终端上正常工作吗?