如何以可以向用户显示的方式将EUC-JP转码为Unicode?

时间:2016-01-19 01:58:22

标签: java unicode transcoding

您好我正在为Android构建一个简单的应用程序,它允许用户查找kanji并查看其“部件”。 要做到这一点,我正在data file网站上找到this,并且包含我需要展示的汉字部分。

问题是它没有以unicode编码,我还没有找到一个可以正确显示文件内容的程序。我不完全确定编码是什么,但我怀疑它是CP932

如何将文件转码为可以显示给用户的内容(并由java操纵)?

以下是内容中的示例:

±ú : Ñá
±û : ¥Î °ì Âç ÑÌ
±ü : Âç ÊÆ ÑÄ
±ý : ²¦ Ц ×Æ
±þ : ¿´ Öø
²¡ : ¡Ã Æü Ù© ÅÄ
²¢ : ²¦ Æü
²£ : ¡Ã ²« ÅÄ Æó Æü ¥Ï ÌÚ ×°
²¤ : ·ç Ò¹ ¥Î Ц
²¥ : ¥Î Ц Ò¹ ÝÕ ÑÜ Ëô
²¦ : ²¦
²§ : ±© ¥Ï ÑÒ ÒÓ
²¨ : ½é Âç ÊÆ ÑÄ ÈÐ
²© : ¾° Ä» ÑÌ Û¿
²ª : Ä» Ò¹ Û¿ ¥Î Ц
²« : ²« ÅÄ ¥Ï
²¬ : Öõ ÑÄ °ì »³ ²¬
²­ : ¡Ã ½Á ¸ý
²® : ²Ð ÈÈ çè
²¯ : ²» ²½ ¿´ Æü Ω
²° : »ê ÅÚ ÒÓ Õù
²± : ²» ¿´ Æü Ë» Ω
²² : ²» ·î ¿´ Æü Ω
²³ : ÌÚ ÍÑ ¥Þ
²´ : µí ÅÚ
²µ : ²µ
²¶ : ²µ ²½ Âç ±â

1 个答案:

答案 0 :(得分:1)

文件以EUC-JP编码(不是Shift-JIS或CP932)。您可以使用iconv之类的工具将文件转换为离线版UTF,也可以在创建InputStreamReader时指定字符集来在线转换文件。