Question

我有以下网址：

url = http://photographs.500px.com/kyle/09-09-201315-47-571378756077.jpg

我想在此网址中提取文件名：09-09-201315-47-571378756077.jpg

获得此文件名后，我将使用此名称将其保存到桌面。

filename = **extracted file name from the url**     
download_photo = urllib.urlretrieve(url, "/home/ubuntu/Desktop/%s.jpg" % (filename))

在此之后，我将调整照片的大小，一旦完成，我将保存调整大小的版本并在文件名的末尾附加单词“_small”。

downloadedphoto = Image.open("/home/ubuntu/Desktop/%s.jpg" % (filename))               
resize_downloadedphoto = downloadedphoto.resize.((300, 300), Image.ANTIALIAS)
resize_downloadedphoto.save("/home/ubuntu/Desktop/%s.jpg" % (filename + _small))

从这里，我想要实现的是获取两个文件，原始照片与原始名称，然后调整大小的照片与修改后的名称。像这样：

09-09-201315-47-571378756077.jpg

09-09-201315-47-571378756077_small.jpg

我该怎么做呢？

Answer 1

您可以使用urlparse和os.path内置python模块。例如：

>>> import urlparse, os
>>> url = "http://photographs.500px.com/kyle/09-09-201315-47-571378756077.jpg"
>>> a = urlparse.urlparse(url)
>>> a.path
'/kyle/09-09-201315-47-571378756077.jpg'
>>> os.path.basename(a.path)
'09-09-201315-47-571378756077.jpg'

如果导入urlparse时遇到问题，请尝试以下操作：

Python 2

from six.moves.urllib.parse import urlparse

Python 3

from urllib.parse import urlparse

Answer 2

filename = url[url.rfind("/")+1:]
filename_small = filename.replace(".", "_small.")

可能在最后一种情况下使用“.jpg”，因为a。也可以在文件名中。

Answer 3

您可以将网址拆分为“/”并检索列表的最后一个成员：

    url = "http://photographs.500px.com/kyle/09-09-201315-47-571378756077.jpg"
    filename = url.split("/")[-1] 
    #09-09-201315-47-571378756077.jpg

然后使用replace更改结尾：

    small_jpg = filename.replace(".jpg", "_small.jpg")
    #09-09-201315-47-571378756077_small.jpg

Answer 4

os.path.basename(url)

为什么要更加努力？

In [1]: os.path.basename("https://foo.com/bar.html")
Out[1]: 'bar.html'

In [2]: os.path.basename("https://foo.com/bar")
Out[2]: 'bar'

In [3]: os.path.basename("https://foo.com/")
Out[3]: ''

In [4]: os.path.basename("https://foo.com")
Out[4]: 'foo.com'

Answer 5

使用urllib.parse.urlparse仅获取path part of the URL，然后在该路径上使用pathlib.Path获取文件名：

from urllib.parse import urlparse
from pathlib import Path


url = "http://example.com/some/long/path/a_filename.jpg?some_query_params=true&some_more=true#and-an-anchor"
a = urlparse(url)
a.path             # '/some/long/path/a_filename.jpg'
Path(a.path).name  # 'a_filename.jpg'

Answer 6

使用 python3（从 3.4 起），您可以通过以下方式滥用 pathlib 库：

from pathlib import Path

p = Path('http://example.com/somefile.html')
print(p.name)
# >>> 'somefile.html'

print(p.stem)
# >>> 'somefile'

print(p.suffix)
# >>> '.html'

print(f'{p.stem}-spamspam{p.suffix}')
# >>> 'somefile-spamspam.html'

Answer 7

Python split url to find image name and extension

可帮助您提取图像名称。附加名称：

imageName =  '09-09-201315-47-571378756077'

new_name = '{0}_small.jpg'.format(imageName)

Answer 8

有时会有一个查询字符串：

filename = url.split("/")[-1].split("?")[0] 
new_filename = filename.replace(".jpg", "_small.jpg")

Answer 9

使用 os 包的简单版本：

import os

def get_url_file_name(url):
    url = url.split("#")[0]
    url = url.split("?")[0]
    return os.path.basename(url)

示例：

print(get_url_file_name("example.com/myfile.tar.gz"))  # 'myfile.tar.gz'
print(get_url_file_name("example.com/"))  # ''
print(get_url_file_name("https://example.com/"))  # ''
print(get_url_file_name("https://example.com/hello.zip"))  # 'hello.zip'
print(get_url_file_name("https://example.com/args.tar.gz?c=d#e"))  # 'args.tar.gz'

Answer 10

我们可以使用ntpath模块从网址中提取文件名。

import ntpath
url = 'http://photographs.500px.com/kyle/09-09-201315-47-571378756077.jpg'
name, ext = ntpath.splitext(ntpath.basename(url))
# 09-09-201315-47-571378756077  .jpg


print(name + '_small' + ext)
09-09-201315-47-571378756077_small.jpg

如何从URL中提取文件名＆amp;对它说一句话？

10 个答案: