我正在使用@diegoperini's regex from this site:
_^(?:(?:https?|ftp)://)(?:\S+(?::\S*)?@)?(?:(?!10(?:\.\d{1,3}){3})(?!127(?:\.\d{1,3}){3})(?!169\.254(?:\.\d{1,3}){2})(?!192\.168(?:\.\d{1,3}){2})(?!172\.(?:1[6-9]|2\d|3[0-1])(?:\.\d{1,3}){2})(?:[1-9]\d?|1\d\d|2[01]\d|22[0-3])(?:\.(?:1?\d{1,2}|2[0-4]\d|25[0-5])){2}(?:\.(?:[1-9]\d?|1\d\d|2[0-4]\d|25[0-4]))|(?:(?:[a-z\x{00a1}-\x{ffff}0-9]+-?)*[a-z\x{00a1}-\x{ffff}0-9]+)(?:\.(?:[a-z\x{00a1}-\x{ffff}0-9]+-?)*[a-z\x{00a1}-\x{ffff}0-9]+)*(?:\.(?:[a-z\x{00a1}-\x{ffff}]{2,})))(?::\d{2,5})?(?:/[^\s]*)?$_iuS
我得到了:
ValueError: invalid \x escape
对于正则表达式的一部分,在一些地方有一个\ x {某个十六进制数}。
有没有办法让这项工作?我试过了\\x
和\xffff
,似乎都没有效果。
编辑:Python端口位于gist。搜索“adamrofer”。它完全是jwodder提出的解决方案。
答案 0 :(得分:4)
As detailed here,\xFF
仅在后面跟着正好两个没有大括号的十六进制数字时起作用。如果您有四个十六进制数字,则必须使用\u
代替\uFFFF
- 并且在极少数情况下,您有八个十六进制数字,\U
:{{1 }}