有没有办法让所有字符等同于语言环境中的给定char

时间:2012-03-14 09:38:11

标签: java regex unicode locale icu

我正在研究java的icu包。我正在寻找的方法是传递给定的语言环境和给定的代码点,并获得“等效”的字符列表。

我在法语中查看[= e =]的POSIX charclass,法语中所有与'e'相同的字符是什么? e,é,è和ê

我查看了每个人似乎都在使用的icu软件包,并没有找到办法做到这一点。

注意:这似乎与另一个问题相反。

安迪

2 个答案:

答案 0 :(得分:2)

这取决于您的等价物的含义,但您可以使用Collator来查看哪些字符将被排序在一起。您可以从Locale

获取默认展开器
Collator.getInstance(Locale.FRANCE);

将其投射到RuleBasedCollator可以执行以下操作:

((RuleBasedCollator)Collator.getInstance(Locale.FRANCE)).getRules();

这将显示等价表。

答案 1 :(得分:1)