我有一些这样的链接:
https://www.site.comf/floyda1bentley.html
https://www.site.coma/aarondoh.html
https://www.site.comp/pinkfloyd.html
我必须删除“ .com”之后的字母。但是我对regex真的很陌生,甚至不理解类似的问题来将它们应用于我的案例。我了解(也许)必须使用环顾四周。.
谢谢你的建议
答案 0 :(得分:2)
假设您具有链接列表,则可以在列表理解中使用re.sub()
:
[re.sub(r'\.com[a-z]', '.com', l) for l in links]
收益:
https://www.example.com/floyda1bentley.html
https://www.example.com/aarondoh.html
https://www.example.com/pinkfloyd.html