将图像从URL保存到特殊文件夹

时间:2015-06-21 14:55:04

标签: python web-scraping beautifulsoup

我想将图片从网址保存到特殊文件夹,例如'my_images',但不是默认(我的* .py文件所在的位置)。有可能成功吗? 因为我的代码使用* .py文件将所有图像保存到文件夹。 这是我的代码:

import urllib.request
from bs4 import BeautifulSoup
import re
import os

BASE_URL = 'https://fachowiec.com/sklep/pl/products/index?Products_page=1&pageSize=15'
def get_domain(url):
    domain = re.findall(r'https:\W\W\w+\.\w+', url)
    return domain[0]


def get_html(url):
    request = urllib.request.urlopen(url)
    return request.read()

def get_img(html):
    soup = BeautifulSoup(html)
    img_box = []
    imgs = soup.find_all('div', class_= 'pthumb')

    for img in imgs:
        img_box.append(get_domain(BASE_URL) + img.img['src'])

    for img in img_box:
        urllib.request.urlretrieve(img, os.path.basename(img))


def main():
    get_img(get_html('https://fachowiec.com/sklep/pl/products/index?Products_page=1&pageSize=15'))

if __name__ == '__main__':
    main()

2 个答案:

答案 0 :(得分:2)

def get_img(html):
    soup = BeautifulSoup(html)
    img_box = []
    imgs = soup.find_all('div', class_= 'pthumb')

    for img in imgs:
        img_box.append(get_domain(BASE_URL) + img.img['src'])

    my_path = '/home/<username>/Desktop'  # use whatever path you like
    for img in img_box:
        urllib.request.urlretrieve(img, os.path.join(my_path, os.path.basename(img)))

答案 1 :(得分:0)

您应该在urllib.request.urlretrieve的第二个参数中添加路径名。如下所示:

urllib.request.urlretrieve(img, "PATH"+os.path.basename(img))

第二个参数(如果存在)指定要复制到的文件位置(如果不存在,该位置将是具有生成名称的临时文件)。