Question

我正在写这些代码行：

String name1 = fname.getText().toString();
String name2 = sname.getText().toString();
aru = 0;

count1 = name1.length();
count2 = name2.length();
for (i = 0; i < count1; i++)
{  
    for (j = 0; j < count2; j++)
    { 
        if (name1.charAt(i)==name2.charAt(j))
            aru++;
    }
    if(aru!=0)
        aru++;
}

我想比较两个Character的{{1}} s忽略这个案例。简单地使用String不起作用。添加“65”IgnoreCase值也不起作用。我该怎么做？

Answer 1

Character类Java API具有您可以使用的各种功能。

您可以将两边的char转换为小写：

Character.toLowerCase(name1.charAt(i)) == Character.toLowerCase(name2.charAt(j))

还有一种方法可用于验证字母是大写还是小写：

Character.isUpperCase('P')
Character.isLowerCase('P')

Answer 2

你不能实际使用toLowerCase在字符串或字符中完成正确的工作。问题是大写或小写都有变体字形，并且取决于你是否大写或小写你的字形可能会或可能不会被保留。当你说小写字形的两个变体被比较忽略大小时，它甚至不清楚你的意思：它们是不是相同？（请注意，还有混合大小写字形：\u01c5, \u01c8, \u01cb, \u01f2或ǅ，ǈ，ǋ，ǲ，但是这里建议的任何方法都适用于那些，只要它们应该与它们的完全上部或完全下部相同案例变体。）

使用Char还有一个问题：大约80个代码点无法用单个Char代表大小/小写变体（每个40个），至少检测到Java的代码点上/下外壳。因此，您需要获取代码点并更改这些代码。

但是代码点对变体字形没有帮助。

无论如何，这里有一个由于变体而有问题的字形的完整列表，显示它们如何对抗6种变体方法：

字符toLowerCase
字符toUpperCase
字符串toLowerCase
字符串toUpperCase
字符串equalsIgnoreCase
字符toLowerCase(toUpperCase)（反之亦然）

对于这些方法，S表示变体的处理方式彼此相同，D表示变体被视为彼此不同。

Behavior     Unicode                             Glyphs
===========  ==================================  =========
1 2 3 4 5 6  Upper  Lower  Var Up Var Lo Vr Lo2  U L u l l2
- - - - - -  ------ ------ ------ ------ ------  - - - - -
D D D D S S  \u0049 \u0069 \u0130 \u0131         I i İ ı   
S D S D S S  \u004b \u006b \u212a                K k K     
D S D S S S  \u0053 \u0073        \u017f         S s   ſ   
D S D S S S  \u039c \u03bc        \u00b5         Μ μ   µ   
S D S D S S  \u00c5 \u00e5 \u212b                Å å Å     
D S D S S S  \u0399 \u03b9        \u0345 \u1fbe  Ι ι   ͅ ι 
D S D S S S  \u0392 \u03b2        \u03d0         Β β   ϐ   
D S D S S S  \u0395 \u03b5        \u03f5         Ε ε   ϵ   
D D D D S S  \u0398 \u03b8 \u03f4 \u03d1         Θ θ ϴ ϑ   
D S D S S S  \u039a \u03ba        \u03f0         Κ κ   ϰ   
D S D S S S  \u03a0 \u03c0        \u03d6         Π π   ϖ   
D S D S S S  \u03a1 \u03c1        \u03f1         Ρ ρ   ϱ   
D S D S S S  \u03a3 \u03c3        \u03c2         Σ σ   ς   
D S D S S S  \u03a6 \u03c6        \u03d5         Φ φ   ϕ   
S D S D S S  \u03a9 \u03c9 \u2126                Ω ω Ω     
D S D S S S  \u1e60 \u1e61        \u1e9b         Ṡ ṡ   ẛ

进一步复杂化的是，除非你知道你是土耳其语，否则没有办法让土耳其语我是正确的（即点缀版本与未注册的版本不同）。这些方法都没有给出正确的行为，除非您知道区域设置（即非土耳其语：i和I是相同的忽略案例;土耳其语，不是）。

总体而言，使用toUpperCase可以得到最接近的近似值，因为您只有五个大写变体（或四个，不包括土耳其语）。

您还可以尝试专门拦截这五个麻烦的案例，并单独调用toUpperCase(toLowerCase(c))。如果你仔细选择你的警卫（只有toUpperCase如果c < 0x130 || c > 0x212B，那么通过其他选择）你可以对低范围内的角色只获得约20％的速度惩罚（相比之下，约为4倍）你将单个字符转换为字符串并将equalsIgnoreCase转换为字符串，如果你在危险区域有很多，那么只会大约2倍的惩罚。你仍然有点缀I的语言环境问题，但你的身材还不错。当然，如果你可以在更大的字符串上使用equalsIgnoreCase，那么你最好这样做。

以下是执行此任务的示例Scala代码：

def elevateCase(c: Char): Char = {
  if (c < 0x130 || c > 0x212B) Character.toUpperCase(c)
  else if (c == 0x130 || c == 0x3F4 || c == 0x2126 || c >= 0x212A)
    Character.toUpperCase(Character.toLowerCase(c))
  else Character.toUpperCase(c)
}

Answer 3

您可以在使用之前更改String的大小写，例如

String name1 = fname.getText().toString().toLowerCase(); 
String name2 = sname.getText().toString().toLowerCase();

然后继续休息操作。

Answer 4

你可以put both chars in lower case然后比较它们。

Answer 5

在比较字符/ lowercasing / uppercasing时，你必须考虑土耳其语问题：

我建议转换为String并使用带有不变文化的toLowerCase（至少在大多数情况下）。

public final static Locale InvariantLocale = new Locale（Empty，Empty，Empty）; str.toLowerCase（InvariantLocale）

查看类似的C＃ string.ToLower() and string.ToLowerInvariant()

注意：不要使用String.equalsIgnoreCase http://nikolajlindberg.blogspot.co.il/2008/03/beware-of-java-comparing-turkish.html

Answer 6

通过忽略大小写比较2个字符串之间位置的字符的通用方法。

public static boolean isEqualIngoreCase(char one, char two){
    return Character.toLowerCase(one)==Character .toLowerCase(two);
}

public static boolean isEqualStringCharIgnoreCase(String one, String two, int position){
    char oneChar = one.charAt(position);
    char twoChar = two.charAt(position);
    return isEqualIngoreCase(oneChar, twoChar);
}

函数调用

boolean isFirstCharEqual = isEqualStringCharIgnoreCase("abc", "ABC", 0)

Answer 7

这就是JDK的做法（改编自OpenJDK 8，String.java/regionMatches）：

static boolean charactersEqualIgnoringCase(char c1, char c2) {
  if (c1 == c2) return true;

  // If characters don't match but case may be ignored,
  // try converting both characters to uppercase.
  char u1 = Character.toUpperCase(c1);
  char u2 = Character.toUpperCase(c2);
  if (u1 == u2) return true;

  // Unfortunately, conversion to uppercase does not work properly
  // for the Georgian alphabet, which has strange rules about case
  // conversion.  So we need to make one last check before
  // exiting.
  return Character.toLowerCase(u1) == Character.toLowerCase(u2);
}

我想这对土耳其人也适用吗？

如何比较原始类型中的字符忽略情况

7 个答案: