我有一些我需要下载的图片。我看到一些网址在图片扩展后有不需要的字符,我需要在下载之前删除/删除。
例如,以下网址在jpeg扩展名后面包含?6ce6a3=
,需要删除;图片扩展名可以是png
,jpg
,jpeg
或gif
。我需要你的输入怎么做。我是否需要使用正则表达式或python中已有的函数。我知道有各种strip()
方法可用,但我不确定哪种方法效果最好。一点指导会有所帮助。我在这里找到了一个类似的问题:Removing unwanted characters after extension但是事先你必须知道你的扩展。
url = 'http://4.kicksonfire.net/wp-content/uploads/2014/10/12.jpeg?6ce6a3='
print os.path.basename(url) # result 12.jpeg?6ce6a3=
print os.path.splitext(url)[1] # .jpeg?6ce6a3=
答案 0 :(得分:1)
将os.path.basename()
与str.partition()
结合使用:
print os.path.basename(url).partition("?")[0]