这应该很容易。
假设我在R中有这个字符串:
a <- "%C3%B6sterlich
这意味着:
österlich
(在德语中意为'东方')
但是,如果我URLdecode(a)
,我会得到:
[1] "österlich"
这在某种程度上是有道理的,因为%C3是Ã而%B6是ASCII URL编码中的¶。但正如你在这里看到的: http://www.backbone.se/urlencodingUTF8.htm ,%C3%B6表示采用UTF-8编码的ö。
现在的问题是:如何告诉URLdecode()
使用UTF-8表?
答案 0 :(得分:3)
试试这个:
> Encoding(a) <- "UTF-8"
或使用iconv功能:
http://stat.ethz.ch/R-manual/R-devel/library/base/html/iconv.html http://astrostatistics.psu.edu/datasets/2006tutorial/html/utils/html/iconv.html
希望它有所帮助^ _ ^