如何比较非英语字符和重音符号

时间:2012-10-17 05:51:03

标签: java special-characters string-comparison

我想比较其中有两个非英文字符的字符串

String1 = debarquer
String2 = débárquér

在比较上面两个字符串时,他们应该说相等。

4 个答案:

答案 0 :(得分:23)

使用Collat​​or类。它允许您设置强度和区域设置,它将适当地比较字符。

它应该与此类似(注意:我没有测试过该程序)

import java.text.Collator;
import java.util.Locale;

public class CollatorExp {

    public static void main(String[] args) {
        Collator collator = Collator.getInstance(Locale.FRENCH);
        collator.setStrength(Collator.PRIMARY);

        if (collator.compare("débárquér", "debarquer") == 0) {
            System.out.println("Both Strings are equal");
        } else {
            System.out.println("Both Strings are not equal");
        }
    } 
}

更新:值得注意的是,“débárquér”和“debarquer”永远不应被视为平等。但是如果你要对它们进行排序,那么你不希望它们根据它们的ASCII值进行比较。以“Joao”和“João”为例:如果你根据ASCII对它们进行排序,你可能会得到Joao,John,João。这显然不太好。使用collat​​or类可以正确处理它。

答案 1 :(得分:11)

为此,您可以使用Java的Normalizer类。只需将字符串标准化,然后删除变音标记,如下所示:

String stripAccents(String string) {
    string = Normalizer.normalize(string, Normalizer.Form.NFD);
    string = string.replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}

然后您可以使用它来比较两个字符串减去重音:

stripAccents(string1).equals(stripAccents(string2))

答案 2 :(得分:-2)

if (string1 != null){
if (string1.equals(string2)){
System.out.println("Equal");
}
else{
System.out.println("Not Equal");
}

答案 3 :(得分:-3)

有一种方法可以比较java中的2个字符串值。

        if(String1.equals(String2))
        {
           System.out.println("Equal");
        }
        else
        {
           System.out.println("Not equal");
        }