如何转换以下汉字?

时间:2011-10-25 16:44:11

标签: unicode encoding character-encoding cjk

我的程序中显示了一些文字。但是我在textedit中打开它并且文本不可读。有人告诉我这是汉字。我需要做些什么来使其可读?

•—§WƸ¨v∞”¡`∑|™∫•|¶Ï•N™Ì

我正在使用OSX打开此文件。文件采用文本格式。以上是一个示例行。

1 个答案:

答案 0 :(得分:2)

  

•-§WƸ¨v∞”¡`Σ|™∫•|¶Ï个•N™I

如果您将文本文件视为MacRoman编码,当它实际包含其他内容时,您就会得到这种结果。

可能只是你的文本编辑器已经猜到了MacRoman,因为它没有别的东西可以继续。可以想象,文本文件被破坏并用UTF中的那些字符保存,但更可能的是文件的字节是:

A5 D1 A4 57 AE FC AC 76 B0 D3 C1 60 B7 7C AA BA A5 7C A6 EC A5 4E AA ED

这些字节看起来很像Big-5。使用Big-5字符集对它们进行解码可以获得:

由上海洋商總會的四位代表

看起来非常可能。

因此,要读取文件,请使用Big-5字符集获取字节并对其进行解码。你如何做到这一点取决于你正在使用的语言。