我遇到了一个关于String的匹配(RegExp)方法的有趣问题。
assertTrue("33CCFF".matches("[0-9A-Za-z]{6}"));
assertTrue("CC33FF".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3355".matches("[0-9A-Za-z]{6}"));
assertTrue("CC9955".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3366".matches("[0-9A-Za-z]{6}"));
assertTrue("CC3965".matches("[0-9A-Za-z]{6}"));
assertTrue("CC1961".matches("[0-9A-Za-z]{6}"));
assertTrue("CC9999".matches("[0-9A-Za-z]{6}"));
assertTrue("СС3966".matches("[0-9A-Za-z]{6}")); // failing
assertTrue("СС9965".matches("[0-9A-Za-z]{6}")); // failing
assertTrue("СС9966".matches("[0-9A-Za-z]{6}")); // failing
最后3个断言意外失败。我找不到为什么会发生这种奇怪的行为的原因。你有同样的问题吗?你有什么想法吗?
顺便提一下,如果被问到,我的java版本如下。
java version "1.6.0_26"
Java(TM) SE Runtime Environment (build 1.6.0_26-b03)
Java HotSpot(TM) 64-Bit Server VM (build 20.1-b02, mixed mode)
答案 0 :(得分:15)
最后三个实际以ASCII“C”字符开头。它们以非ASCII字符开头,看起来像[0-9A-Za-z]
集中的任何内容都不匹配,因此模式失败。
(我通过将代码复制并粘贴到文本编辑器中来发现这一点,该文本编辑器不能非常好地处理非ASCII字符 - 它们以“?”形式出现。)
答案 1 :(得分:2)
你的“СС3966”(我正在剪切和粘贴)被标记为非UTF-8,这就是为什么reg-ex与它们不匹配的原因。当我更改您的文本并自己键入它时,它按预期工作。不确定从哪里复制这些值,但这是你的问题