我正在尝试分析文件中带有不可打印Unicode字符的某些日志:
02 Aug 2018 18:00:00,531 ^[[32m[TEXT]^[[m (ussouth-dc2-ms-2012) This.is.test.log: Service is responding normal
如何避免使用^[[32m
和^[[m
?
^([0-9]{2}\s[A-Za-z]{3}\s[0-9]{4}\s[0-9]{2}:[0-9]{2}:[0-9]{2}(?:,[0-9]{3})?)\s(?:\^\[\[[0-9]{2}m)\[([A-Za-z]+)\](?:\^\[\[m)\s(.*)
我当前的正则表达式将它们视为正常字符,这似乎可以正常工作,可以在经过测试的在线正则表达式中复制粘贴,但是当我使用系统正则表达式(可能使用Java)时,它无法解析,这是因为文件包含不可打印的字符Unicode字符。