正则表达式匹配特定网站的网址

时间:2009-07-10 00:21:28

标签: regex

我正在尝试编写一个匹配这两个URL的python正则表达式:

http://www.waymarking.com/waymarks/WM6N3G_Battle_Mountain_State_Park
http://www.waymarking.com/waymarks/WM6N3G

并且两者都将捕获:

http://www.waymarking.com/waymarks/WM6N3G

这就是我所拥有的:

(http://www.waymarking.com/waymarks/.*?)_?.*?

但它只匹配:

http://www.waymarking.com/waymarks/

谢谢!

6 个答案:

答案 0 :(得分:4)

(http://www.waymarking.com/waymarks/[^_]*).*

答案 1 :(得分:1)

怎么样

(http://www.waymarking.com/waymarks/[^_]+)

答案 2 :(得分:0)

非正则表达方式

url="http://www.waymarking.com/waymarks/WM6N3G_Battle_Mountain_State_Park"
s = url.split("_")
print s[0]

答案 3 :(得分:0)

*?使某些东西完全是可选的,如果没有

则不包括在内
(http://www.waymarking.com/waymarks/[^_]+)(_.*)?)

答案 4 :(得分:0)

这个怎么样:

 (http://www.waymarking.com/waymarks/[a-zA-Z0-9]*)_?.*?

答案 5 :(得分:0)

.*(http://www.waymarking.com/waymarks/WM6N3G).*如果是内联

。*?是非贪婪的,所以在这种情况下,除了一个角色之外都会放弃一切。