无法检测到字符串编码

时间:2018-07-19 07:28:29

标签: string encoding utf-8

您能找出下面的字符串使用什么编码吗?应该用带有重音符号e的简历一词。我尝试在vi中将编码设置为latin-1(默认为utf-8),但仍然无法读取。

72 ef bf bd 73 75 6d ef bf bd

|r...sum...|        

2 个答案:

答案 0 :(得分:3)

您的十六进制数据是字符串r�sume�的UTF-8编码,其中ef bf bd替换字符的编码,通常显示为黑色的问号背景。

因此您的字符串已损坏。有时可能是résumé。但随后将其保存为不带重音符号e的编码,然后将其替换为替换字符

答案 1 :(得分:2)

EF BF BD是Unicode替换字符U + FFFD的UTF-8编码。

这意味着,无论您如何解码,它都不会拼写ré­su­mé。

沿着这条线的某个地方已经弄乱了解码(大概是通过使用错误的解码来对byte[]进行解码)。