在Windows中将旧版Mac OS日语编码转换为Unicode

时间:2013-05-23 06:00:13

标签: windows unicode character-encoding cjk

几年前,Apple发布了一份文档,概述了Apple的“Mac OS Japanese”字符集和Unicode代码点之间的映射。 (ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/JAPANESE.TXT

Microsoft提供了函数MultiByteToWideChar,以帮助将字符映射到UTF-16字符串。

MultiByteToWideChar可正常处理Apple旧版字符集中的某些日文字符(请参阅上面的FTP链接),但其他人返回“无可用映射”(例如,0x85BE应映射到Unicode 0x217B(SMALL ROMAN NUMERAL TWELVE)) ,但它失败了。)

我使用的是代码页10001(日语 - Mac)。

我是否忽略了一些显而易见的事情,或者将日文-Mac映射到UTF-16的代码页在Windows上完全不完整?

1 个答案:

答案 0 :(得分:2)

x-mac-japanese通常被Windows视为SHIFT_JIS - 问题是x-mac-japanese是SHIFT_JIS的超集,因此缺少东西。例如,the 0x85oo range in SHIFT_JIS中没有任何内容。