如何从十六进制值中识别编码?

时间:2016-07-11 09:44:24

标签: encoding character-encoding

我的网站上的文字显示如下:而不是ö

我从CMS中提取文本并分析它的十六进制值:

  • 正确显示的ö有c3 b6 - UTF-8
  • 显示错误的ö6f cc 88

我无法找出这是什么编码。识别编码的好方法是什么?

1 个答案:

答案 0 :(得分:1)

6F是“o”的UTF-8(ASCII)编码,没什么了不起的 CC 88U+0308, COMBINING DIAERESIS的UTF-8编码。

你只是看着o-umlaut的分解形式。结合的diaereses字符应该在视觉上呈现,以及组合与前一个字符。如果您的系统没有这样做,则意味着它没有正确处理Unicode,和/或您选择的字体有些破碎。也许您必须将normalise字符串转换为组合的Unicode表单,而不是让系统正确处理它。