标签: regex
我试图编写一个查找所有unicode并将其删除的正则表达式。
示例:
\ ud83e \ udd80
当我这样做时:[^\u0000-\u007F],它与实际的单个Unicode字符匹配。
[^\u0000-\u007F]
我要匹配的是实际反斜杠,前面有五个字符
我该怎么做?
答案 0 :(得分:1)
如果您希望匹配看起来像\u0002的每个字符串,则可以使用此正则表达式
\u0002
\\[0-9a-zA-Z]{5}
我不确定这是否是您想要的,但是您可以测试更多案例here
答案 1 :(得分:0)
尝试使用正则表达式:\\u[A-Fa-f0-9]{4,6}
\\u[A-Fa-f0-9]{4,6}
Demo