在字符串中的图像扩展后删除不需要的字符

时间:2016-03-31 17:55:20

标签: python

我有一些我需要下载的图片。我看到一些网址在图片扩展后有不需要的字符,我需要在下载之前删除/删除。

例如,以下网址在jpeg扩展名后面包含?6ce6a3=,需要删除;图片扩展名可以是pngjpgjpeggif。我需要你的输入怎么做。我是否需要使用正则表达式或python中已有的函数。我知道有各种strip()方法可用,但我不确定哪种方法效果最好。一点指导会有所帮助。我在这里找到了一个类似的问题:Removing unwanted characters after extension但是事先你必须知道你的扩展。

url = 'http://4.kicksonfire.net/wp-content/uploads/2014/10/12.jpeg?6ce6a3='
print os.path.basename(url) # result 12.jpeg?6ce6a3=
print os.path.splitext(url)[1] # .jpeg?6ce6a3=

1 个答案:

答案 0 :(得分:1)

os.path.basename()str.partition()结合使用:

print os.path.basename(url).partition("?")[0]