Question

我有一些我需要下载的图片。我看到一些网址在图片扩展后有不需要的字符，我需要在下载之前删除/删除。

例如，以下网址在jpeg扩展名后面包含?6ce6a3=，需要删除;图片扩展名可以是png，jpg，jpeg或gif。我需要你的输入怎么做。我是否需要使用正则表达式或python中已有的函数。我知道有各种strip()方法可用，但我不确定哪种方法效果最好。一点指导会有所帮助。我在这里找到了一个类似的问题：Removing unwanted characters after extension但是事先你必须知道你的扩展。

url = 'http://4.kicksonfire.net/wp-content/uploads/2014/10/12.jpeg?6ce6a3='
print os.path.basename(url) # result 12.jpeg?6ce6a3=
print os.path.splitext(url)[1] # .jpeg?6ce6a3=

Answer 1

将os.path.basename()与str.partition()结合使用：

print os.path.basename(url).partition("?")[0]

在字符串中的图像扩展后删除不需要的字符

1 个答案: