避免/非捕获非可打印Unicode字符正则表达式

时间:2018-08-13 18:41:34

标签: java regex

我正在尝试分析文件中带有不可打印Unicode字符的某些日志:

02 Aug 2018 18:00:00,531 ^[[32m[TEXT]^[[m  (ussouth-dc2-ms-2012) This.is.test.log: Service is responding normal

如何避免使用^[[32m^[[m

^([0-9]{2}\s[A-Za-z]{3}\s[0-9]{4}\s[0-9]{2}:[0-9]{2}:[0-9]{2}(?:,[0-9]{3})?)\s(?:\^\[\[[0-9]{2}m)\[([A-Za-z]+)\](?:\^\[\[m)\s(.*)

我当前的正则表达式将它们视为正常字符,这似乎可以正常工作,可以在经过测试的在线正则表达式中复制粘贴,但是当我使用系统正则表达式(可能使用Java)时,它无法解析,这是因为文件包含不可打印的字符Unicode字符。

0 个答案:

没有答案