如何查找数据是英语还是中文

时间:2012-02-01 15:06:25

标签: java cjk

我正在阅读Excel表格,其中我有英文和中文说明。我想区分这些数据。

如何在Java中执行此操作。

中文字符的ASCII范围值是什么。

1 个答案:

答案 0 :(得分:4)

要检查字符串中是否包含所有英文(ASCII)字符,可以检查ASCII范围,如下所示:

// assuming str is your text with some bunch of characters
// returns true if contains all ASCII characters
boolean b = str.matches("^[\u0000-\u0080]+$");

要检查CJK笔划,Unicode范围是

[\u31C0-\u31EF]

Visit this page用于各种Unicode块范围。