转换" unknown-8bit" UTF-8的字符集

时间:2014-11-03 17:44:53

标签: html encoding utf-8 character-encoding

我正在帮助朋友将内容添加到以FrontPage之类的内容编写的旧网站上。但是我有一个html文档,用#34; unknown-8bit"编码。字符集。我工作的Brackets.io仅支持UTF-8,因此我无法打开并将文档重新保存为正确的编码。

如何将此文件转换为UTF-8,以便我可以在bracket.io中使用它?

我使用OS X 10.10 Yosemite,所以我比坐在Windows上更有限(记事本++让人想到)。

google之后我在终端尝试了以下内容,但是" unknown-8bit"不受支持。

iconv -f unknown-8bit -t utf-8 filename.html > newfilename.html

2 个答案:

答案 0 :(得分:8)

您可以使用encachardetenca可能会更成功。

如果您知道文档所使用的语言,您可以猜测编码并尝试转换,直到您获得正确的结果:

  • 英语,法语,德语,西班牙语...... - 通常是Windows-1252

  • 俄语,乌克兰语...... - 通常是Windows-1251

  • 波兰语,捷克语,匈牙利语...... - 通常是Windows-1250或ISO-8859-2

  • 日语 - 通常是Shift-JIS

等等。

答案 1 :(得分:0)

还有Brackets extension to convert files to UTF-8 encoding,所以你不必离开你的编辑。但是,如果其他工具无法识别/转换原始文件的编码,我猜这个扩展会遇到同样的问题。