当图像未存储为url时如何使用python从html下载图像

时间:2018-06-26 13:59:04

标签: html python-2.7 web-scraping urllib2 urllib

嗨,所以我想申请工作,他们给我发了考试 我需要从某些网站下载图片 然后在上面使用ocr,依此类推

但是我不知道如何在不将图像存储在URL中的情况下使用python下载图像 在html上,图像src是这样写的:

<img src="/captcha/1529953967.png">

到目前为止,我的代码看起来像这样

import urllib
import urllib2
import re
import os


my_url = "http://perltest.my-mobile.org/c/test.cgi?u=foo&p=bar"
my_html = urllib2.urlopen(my_url).read()

my_img = re.findall(r'<img src="(.*?)"/>',str(my_html))[0]

print my_img  # prints --> /captcha/1529953967.png

name = "ocr_me.jpg"
test_img = "http://www.miadumont.com/wp-content/uploads/2011/06/chatons-Linda.jpg"
test_name = "test.jpg"

urllib.urlretrieve(my_url + my_img, name) # does not work 
urllib.urlretrieve(test_img, test_name) # saves a test image of a cat 

p.s我需要代码才能在其服务器上运行,所以我必须使用python2.7 而且我无法下载其他任何库,例如bs4

所以先谢谢您

0 个答案:

没有答案