如何将默认的UTF-8编码更改为LATIN1

时间:2015-02-13 12:51:25

标签: r xpath encoding utf-8 latin1

第一次来电。
我只想将字符串编码从UTF-8更改为LATIN1。我使用Xpath从Web检索数据:

>library(RCurl)  
>library(rvest)
>library(XML)
>library(httr)
>library(reshape2)
>library(reshape)

>response <- GET(paste0("http://www.visalietuva.lt/imone/jogminda-uab-telsiai-muziejaus-g-35"))
>doc <- content(response,type="text/html")
>base <- xpathSApply(doc, "//ul//li//span",xmlValue)[5]

结果我得到以下内容:

>base
[1] "El. paštas"

当我检查编码时,我有UTF-8:

>Encoding(base)
[1] "UTF-8"

我怀疑我需要LATIN1编码。因此结果将是“El.paštas”,而不是“El.paÅ¡tas”

虽然当我指定LATIN1编码时,我得到以下内容:

>latin <- iconv(base, from = "UTF-8", to = "LATIN1")
[1] "El. paštas"

即。与UTF-8相同的结果。更改编码无助于“El.paštas”

此外,我需要对字符串进行正确的LATIN1编码,同时将数据保存到.csv文件中。我试图将数据保存到.csv:

write.table(latin,file = "test.csv")

并获得与上述相同的奇怪字符:“El.paÅ¡tas”

有关如何更改编码的任何建议都非常受欢迎。谢谢。

1 个答案:

答案 0 :(得分:0)

尝试

doc <- content(response,type="text/html", encoding = "UTF-8")