在文本中使用特定数量的斜杠获取正则表达式

时间:2015-12-07 11:05:29

标签: regex python-3.x

我有以下文字

http://www.faz.net/aktuell/politik/ausland/amerika/venezuela-das-ende-der-sozialistischen-epoche-13952597.html
http://www.faz.net/aktuell/politik/ausland/bundeswehr-einsatz-von-der-leyen-gesteht-fehler-in-afghanistan-ein-13952438.html
http://www.faz.net/aktuell/politik/inland/bayerns-ehrenamtliche-in-der-fluechtlingskrise-13948777.html

我只想检索那些以http://www.faz.net/aktuell/politik/开头但以.html结尾的链接,其中只有一个斜杠。基本上,避免上面列表中的第一个链接。

我尝试了以下内容 http://www.faz.net/aktuell/politik/.*/.*?\.html

然而,所有人都被选中。如何在第一次避免额外的斜线?请帮忙

1 个答案:

答案 0 :(得分:1)

您可以使用以下内容:

http://www\.faz\.net/aktuell/politik/[^/]*/[^/]*\.html

请参阅DEMO