Python正则表达式再次 - 匹配url第二部分

时间:2011-07-18 14:27:35

标签: python regex

确定。我从here得到正则表达式(仅限WWW链接,第二版)。一切都很好,除了一件事,它也解析了BBCode。

正则表达式

(?i)\b((?:https?://|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:'".,<>?«»“”‘’]))

失败的内容

[IMG] http://example.foo/something.png [/ IMG]

当我应用regexp时,我得到了http://example.foo/something.png [/ img,那就失败了。 :P那里有任何regexp大师吗?

1 个答案:

答案 0 :(得分:0)

这有点粗糙,但试试这个:

$preg = "%(?:https?://|www\d{0,3}.)(?:[\/A-Za-z0-9-_.]+(?!(?:<|\[/([A-Za-z0-9])+?\1)))%";

我已经测试了它,如果我正确理解你的问题,它应该按预期工作。