我正在帮助朋友将内容添加到以FrontPage之类的内容编写的旧网站上。但是我有一个html文档,用#34; unknown-8bit"编码。字符集。我工作的Brackets.io仅支持UTF-8,因此我无法打开并将文档重新保存为正确的编码。
如何将此文件转换为UTF-8,以便我可以在bracket.io中使用它?
我使用OS X 10.10 Yosemite,所以我比坐在Windows上更有限(记事本++让人想到)。
google之后我在终端尝试了以下内容,但是" unknown-8bit"不受支持。
iconv -f unknown-8bit -t utf-8 filename.html > newfilename.html
答案 0 :(得分:8)
您可以使用enca
或chardet
,enca
可能会更成功。
如果您知道文档所使用的语言,您可以猜测编码并尝试转换,直到您获得正确的结果:
英语,法语,德语,西班牙语...... - 通常是Windows-1252
俄语,乌克兰语...... - 通常是Windows-1251
波兰语,捷克语,匈牙利语...... - 通常是Windows-1250或ISO-8859-2
日语 - 通常是Shift-JIS
等等。
答案 1 :(得分:0)
还有Brackets extension to convert files to UTF-8 encoding,所以你不必离开你的编辑。但是,如果其他工具无法识别/转换原始文件的编码,我猜这个扩展会遇到同样的问题。