在R中更改XML文件的unicode

时间:2017-08-24 12:14:06

标签: r xml encoding

我想执行一项简单的任务: 我有60,000个xml文件,我想将它们的编码更改为utf-8。 我想要做的就是编写一种读取xml文件的循环,然后使用正确的编码立即保存它。而已。我怎么能在R?中做到这一点?

1 个答案:

答案 0 :(得分:0)

根据this帖子的建议,使用iconv

一般来说:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html")

在Windows上使用:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), 
           file("tmp2.html", encoding="UTF-8"))