我希望使用R。
将ANSI编码的HTML文件转换为UTF-8是否有可以使这项工作的工具或工具组合?
感谢。
编辑:o.k,我已将问题缩小到另一个问题。它在此处重新发布:Using "cat" to write non-English characters into a .html file (in R)
答案 0 :(得分:22)
你可以使用iconv:
writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html")
tmp2.html应该是utf-8。
Henrik于2015年6月编辑:
从评论中提取的Windows工作解决方案如下:
writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"),
file("tmp2.html", encoding="UTF-8"))
答案 1 :(得分:0)
我对上面提出的解决方案有一些问题,尤其是TAB字符。这种选择永远不会令我失望。不幸的是,它只能在类似UNIX的系统上工作。
system('iconv -f CP1252 -t UTF-8 < tmp.html > tmp2.html')