使用现有的Python 3.5-3.x正则表达式引擎,我已对regex进行了详尽的测试
<body onLoad="mask()">
<a href="http://www.example.com" onclick="unmask()">link</a>
</body>
匹配代码点为U + 0000到U + 007F的所有单个字符,不匹配其他任何字符,同样,正则表达式
re.compile(r"[\x00-\x7F]", re.UNICODE)
匹配代码点为U + 0080到U + 10FFFF的所有单个字符,不匹配其他任何字符。但是,我不知道这是保证还是偶然的。 Python维护人员是否对Unicode模式下的正则表达式字符类中的范围表达式进行了任何形式的官方声明?
官方re module documentation对于范围的确切语义以及其他正则表达式实现(例如, POSIX BREs and EREs,范围表达式和ASCII范围之外的字符之间的交互是明确未指定的。