我的文件名是如何编码的?

时间:2015-06-26 15:33:02

标签: unicode utf-8

很长一段时间后,我来检查硬盘的内容,看到一个奇怪的文件名。

我不确定哪种工具或程序以这种方式改变了它,但是当我看到文件的内容时,我可以找到它的原始名称。

无论如何,我遇到了一种编码,我想找到它。这并不复杂。主要是那些熟悉unicode和utf8的人。现在我映射它们,你猜猜发生了什么。

在下面,我给出了一个映射字符的表格。在第二列中,有utf8形式,在第一列中,它的等效字符被转换。

我需要知道发生了什么以及如何将其转换为将其转换回utf8。也就是说,我所拥有的是第一列,我需要得到的是第二列:

隐藏复制代码

638 2020        646
639 AF          6AF
637 A7          627
637 B1          631
637 B3          633
637 6BE         62A
20          20
638 67E         641
63A 152         6CC

有关更多说明,请考虑第一行,utf8格式为46 06(类型字节)或0x0646。该字符的文件名将转换为两个宽字符,0x0638 0x2020。

1 个答案:

答案 0 :(得分:0)

我自己找到了解决方案。 在Notepad ++中:

  1. 选择"用ANSI编码"来自编码菜单。
  2. 粘贴损坏的文本。
  3. 选择"编码为UTF-8"来自编码菜单。
  4. 那就是它。将显示正确的文本。 如果是这样,我怎么能用Perl做同样的事?