标签: character-encoding
我需要清理一些包含法文文本的文件。问题是文件错误地在同一文件中包含多个编码。
我认为某些部分是ISO8859-1(拉丁文1),但其他部分的文本以单字节字符编码,看起来像'扩展'ASCII。换句话说,它是UTF-7编码加上以下内容:
这是什么编码?
答案 0 :(得分:8)
这是最初的IBM PC编码,Code page 437。
答案 1 :(得分:0)
此网站here显示了cedilla的0x87链接。我没有比这看得多,但我打赌你的其他信息也可以在这里找到。