Question

我的CSV中包含捷克字符，如下所示：

id,address,city
660999,Vršovická 10,Praha
676838,Valentova 50,Praha 4
676858,Husova 6740,Pardubice
677971,Lipová 10,Třebíč
678304,Jana Ziky 10/1955,Ostrava
...

当我导入到RStudio时，如果我使用View（）函数查看它，一切看起来都很好。

View() in Rstudio

但在终端，当我查看价值观时，一切看起来都很疯狂。

xl = read.csv("some_csv.csv")
head(xl)

      id              address      city 
1 660999       VrÅ¡ovickÃ¡ 10     Praha     
2 676838         Valentova 50     Praha 4     
3 676858          Husova 6740   Pardubice     
4 677971           LipovÃ¡ 10     TÅ™ebÃÄ     
5 678304    Jana Ziky 10/1955   Ostrava

当我使用Encoding(xl[1,2])检查编码时，例如"unknown"。

我也有俄罗斯数据同样的问题。

我已尝试切换到Sys.setlocale("LC_CTYPE", "czech")和Sys.setlocale("LC_CTYPE", "russian")并在这些设置下导入，但行为相同。

我在Windows 7上使用Rstudio版本0.98.501和R版本3.0.2。另一台计算机上的同事遇到了同样的问题。

我能做的任何事情都能使这些字符在终端上正常工作吗？

R / Rstudio中奇怪的外来字符行为

0 个答案: