PHP:这个字符串的字符编码是什么?

时间:2011-04-07 23:25:39

标签: php html character-encoding

在PHP中,我有以下字符串:=CA=CC=D1=C8=C9

它的字符编码是什么?

3 个答案:

答案 0 :(得分:6)

It does not make sense to have a string without knowing what encoding it uses.

这5个字节在不同的编码中意味着不同的东西。

  • 在UTF-8中,它无效。所有前导字节和无字节字节。
  • 在ISO-8859-1和windows-1252中,它是字符串ÊÌÑÈÉ
  • 根据chardet,它位于KOI8-R,并解码为йляхи

答案 1 :(得分:1)

你得到的答案和评论假设你已经知道运输编码是“引用可打印的”...使用它进行解码,“= CA = CC = D1 = C8 = C9”变为“\ xCA \ xCC” \ xD1 \ xC8 \ xC9“(这不是UTF-8,正如你在评论中所要求的那样)......而且他们专注于可以合理地使用哪种编码来生成Unicode。要获得UTF-8,还需要两个步骤:将“\ xCA \ xCC \ xD1 \ xC8 \ xC9”解码为Unicode(使用适合阿拉伯语文本的编码),然后编码为UTF-8。

答案 2 :(得分:0)

它被称为引用的可打印

我可以使用以下方式对其进行欺骗:

quoted_printable_decode($string);