R read.table与国际字符

时间:2013-08-13 13:20:46

标签: r utf-8 character-encoding internationalization text-files

我在Windows 7上使用R 3.0.3和RStudio。我需要从网上读取一个带有采样位置名称的表:

server <- 'http://hydrodata.info/api/'
sites_url <- paste(server, 'sites?var=teplota',sep='')
sites <- read.table(sites_url, sep='\t', header=TRUE)
print(sites$name[25])

输出结果为:

  

[1]Tábor468级别:Åindelová(Obora)ÅpiÄák(Åumava)......   ZlatéHory

正确的输出应该是:

  

[1]Tábor468级别:Šindelová(Obora)Špičák(Šumava)......Zlaté   Hory的

为什么国际字符á,Š,é...显示不正确?这是我的R代码或网页上的问题吗?

1 个答案:

答案 0 :(得分:2)

您没有告诉您的默认语言环境是什么(Sys.getlocale( "LC_CTYPE" ))。所以我可以猜测,

sites <- read.table(sites_url, sep='\t', header=TRUE, fileEncoding="utf8")

可能有帮助。