RegEX以匹配Unicode Java转义字符

时间:2019-11-18 16:26:28

标签: regex

我试图编写一个查找所有unicode并将其删除的正则表达式。

示例:

  

\ ud83e \ udd80

当我这样做时:[^\u0000-\u007F],它与实际的单个Unicode字符匹配。

我要匹配的是实际反斜杠,前面有五个字符

我该怎么做?

2 个答案:

答案 0 :(得分:1)

如果您希望匹配看起来像\u0002的每个字符串,则可以使用此正则表达式

\\[0-9a-zA-Z]{5}

我不确定这是否是您想要的,但是您可以测试更多案例here

答案 1 :(得分:0)

尝试使用正则表达式:\\u[A-Fa-f0-9]{4,6}

Demo