使用urlparse删除某个字符串?

时间:2014-08-18 22:49:07

标签: python urlparse

我有这个网址:

www.domain.com/a/b/c/d,authorised=false.html

我希望将其转换为

www.domain.com/a/b/c/d.html

请注意我使用的是python 2.7。

from urlparse import urlparse

url = "www.domain.com/a/b/c/d,athorised=false.html_i_location=http%3A%2F%2Fwww.domain.com%2Fcms%2Fs%2F0%2Ff416e134-2484-11e4-ae78-00144feabdc0.html%3Fsiteedition%3Dintl&siteedition=intl&_i_referer=http%3A%2F%2Fwww.domain.com%2Fhome%2Fus"

o = urlparse(url)
url = o.hostname + o.path
print url

返回www.domain.com/a/b/c/d,authorised=false.html,但我不知道如何从网址中删除authorised=false部分

1 个答案:

答案 0 :(得分:3)

import re
print re.sub(r',.+\.', '.', 'www.domain.com/a/b/c/d,authorised=false.html')

# www.domain.com/a/b/c/d.html