这是什么字符编码?

时间:2010-04-23 17:53:04

标签: character-encoding

我需要清理一些包含法文文本的文件。问题是文件错误地在同一文件中包含多个编码。

我认为某些部分是ISO8859-1(拉丁文1),但其他部分的文本以单字节字符编码,看起来像'扩展'ASCII。换句话说,它是UTF-7编码加上以下内容:

  • 0x82foré(e acute)
  • 0x8aforè(e grave)
  • 0x88forê(e circumflex)
  • 0x85forà(a grave)
  • 0x87forç(c cedilla)

这是什么编码?

2 个答案:

答案 0 :(得分:8)

这是最初的IBM PC编码,Code page 437

答案 1 :(得分:0)

此网站here显示了cedilla的0x87链接。我没有比这看得多,但我打赌你的其他信息也可以在这里找到。