我可以在正则表达式引擎dk.brics.automaton中使用Unicodes吗?

时间:2012-04-05 09:45:44

标签: regex unicode automaton

我想在正则表达式中使用Unicodes。

例如,RegExp =“\ u0061”匹配“a”。但似乎dk.brics.automaton不支持这一点。结果发现匹配“u0061”。我也试过RegExp =“\ u0061”和RegExp =“\\ u0061”。没有人会工作。

如果您对此工具有任何使用经验,请给我一些解决方案吗?

谢谢!

2 个答案:

答案 0 :(得分:1)

最后,我找到了解决这个问题的方法。

首先,我们可以在Java代码中使用Unicodes,但必须单独创建。例如。 String str = "\u0061"+"b";虽然String str = "\u0061b";效果不佳。

其次,如果我们想要读取文本文件中的字符串,例如包含“\u0061b\u0063”的test.txt,我们必须(据我所知)手动将Unicodes替换为相应的符号,因为它们是混合。然后我们可以使用值“abc”获得String str

答案 1 :(得分:0)

我没有 dk.brics.automaton 的经验,但我想在FAQJavaDoc for the RegExp Class中说了一遍。

据我了解,您可以使用unicode字符,但必须将它们表示为字符(“a”)而不是\u0061表示法。