R / Rstudio中奇怪的外来字符行为

时间:2014-03-26 15:06:28

标签: r csv utf-8 character-encoding rstudio

我的CSV中包含捷克字符,如下所示:

id,address,city
660999,Vršovická 10,Praha
676838,Valentova 50,Praha 4
676858,Husova 6740,Pardubice
677971,Lipová 10,Třebíč
678304,Jana Ziky 10/1955,Ostrava
...

当我导入到RStudio时,如果我使用View()函数查看它,一切看起来都很好。

View() in Rstudio

但在终端,当我查看价值观时,一切看起来都很疯狂。

xl = read.csv("some_csv.csv")
head(xl)

      id              address      city 
1 660999       Vršovická 10     Praha     
2 676838         Valentova 50     Praha 4     
3 676858          Husova 6740   Pardubice     
4 677971           Lipová 10     TÅ™ebÃ­Ä     
5 678304    Jana Ziky 10/1955   Ostrava     

当我使用Encoding(xl[1,2])检查编码时,例如"unknown"

我也有俄罗斯数据同样的问题。

我已尝试切换到Sys.setlocale("LC_CTYPE", "czech")Sys.setlocale("LC_CTYPE", "russian")并在这些设置下导入,但行为相同。

我在Windows 7上使用Rstudio版本0.98.501和R版本3.0.2。另一台计算机上的同事遇到了同样的问题。

我能做的任何事情都能使这些字符在终端上正常工作吗?

0 个答案:

没有答案