如何正确处理非英文字符?

时间:2013-03-27 20:48:19

标签: java string unicode character-encoding char

所以我正在使用last.fm API。有时,查询会生成包含以下字符的轨道:

ÆtheréHṛṣṭa

或像这样的非英文字符:

水鏡

在Eclipse中调试时,我看到它们很好(按原样),但在控制台上打印将这些打印为??? - 这对我来说没问题。

现在,我该如何处理这些?起初我虽然可以删除除英语之外的任何其他角色的歌曲。我使用正则表达式^\\w+$但它没有用。我也试过了\\w+。这也不起作用。

然后我进一步思考如何正确处理这些问题。任何人都可以帮助我吗?我完全可以将这些曲目排除在等式之外,即。我只能使用英文字符曲目。

另一个问题:显示控制台和/或Swing GUI的这些特性的最佳方法是什么?

1 个答案:

答案 0 :(得分:0)

首先阅读输入时,必须确保使用正确的编码。

其次确保您开发的平台上的Eclipse中使用的字体能够显示所有这些字符。如果你正确读取它们,Swing必须显示unicode字符。

您可能希望在任何地方使用UTF-8。