我想在正则表达式中使用Unicodes。
例如,RegExp =“\ u0061”匹配“a”。但似乎dk.brics.automaton不支持这一点。结果发现匹配“u0061”。我也试过RegExp =“\ u0061”和RegExp =“\\ u0061”。没有人会工作。
如果您对此工具有任何使用经验,请给我一些解决方案吗?
谢谢!
答案 0 :(得分:1)
最后,我找到了解决这个问题的方法。
首先,我们可以在Java代码中使用Unicodes,但必须单独创建。例如。 String str = "\u0061"+"b";
虽然String str = "\u0061b";
效果不佳。
其次,如果我们想要读取文本文件中的字符串,例如包含“\u0061b\u0063
”的test.txt,我们必须(据我所知)手动将Unicodes替换为相应的符号,因为它们是混合。然后我们可以使用值“abc”获得String str
。
答案 1 :(得分:0)
我没有 dk.brics.automaton 的经验,但我想在FAQ和JavaDoc for the RegExp Class中说了一遍。
据我了解,您可以使用unicode字符,但必须将它们表示为字符(“a”)而不是\u0061
表示法。