我的网站上的文字显示如下:o¨
而不是ö
我从CMS中提取文本并分析它的十六进制值:
c3 b6
- UTF-8 6f cc 88
我无法找出这是什么编码。识别编码的好方法是什么?
答案 0 :(得分:1)
6F
是“o”的UTF-8(ASCII)编码,没什么了不起的
CC 88
是U+0308, COMBINING DIAERESIS的UTF-8编码。
你只是看着o-umlaut的分解形式。结合的diaereses字符应该在视觉上呈现,以及组合与前一个字符。如果您的系统没有这样做,则意味着它没有正确处理Unicode,和/或您选择的字体有些破碎。也许您必须将normalise字符串转换为组合的Unicode表单,而不是让系统正确处理它。