使用R转换文件编码? (ANSI到UTF-8)

时间:2011-09-20 07:52:29

标签: r encoding utf-8 ansi

我希望使用R。

将ANSI编码的HTML文件转换为UTF-8

是否有可以使这项工作的工具或工具组合?

感谢。

编辑:o.k,我已将问题缩小到另一个问题。它在此处重新发布:Using "cat" to write non-English characters into a .html file (in R)

2 个答案:

答案 0 :(得分:22)

你可以使用iconv:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html")

tmp2.html应该是utf-8。


Henrik于2015年6月编辑:
从评论中提取的Windows工作解决方案如下:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), 
           file("tmp2.html", encoding="UTF-8"))

答案 1 :(得分:0)

我对上面提出的解决方案有一些问题,尤其是TAB字符。这种选择永远不会令我失望。不幸的是,它只能在类似UNIX的系统上工作。

system('iconv -f CP1252 -t UTF-8 < tmp.html > tmp2.html')