我有一个方法,旨在从一些html中获取所有img元素,并添加一个css样式,以确保图像大小时调整大小。它在最终测试之前效果很好:largest_size< img_size - 我已经尝试了各种不同的方式来表达这个简单的东西,但它总是评估为真 - 这意味着无论原始大小如何,所有图像都会调整大小。
代码:
def adjust_html(self, html_text):
# pull image links and adjust those larger than 30k
# to be width=100%
html = etree.HTML(html_text)
r = html.xpath('.//img')
changed_text = False
for elem in r:
for tag, value in elem.attrib.iteritems():
if tag == 'src':
largest_size = 30720
img_size = 0
img_url = value
if self.bad_urls.has_key(img_url):
break
try:
usock = urllib2.urlopen(img_url)
img_size = usock.info().get('Content-Length')
except:
self.log.debug("***** 406 for " + img_url)
self.bad_urls[img_url] = True
break
if img_size is None:
break
else:
**if (largest_size < img_size):**
self.log.debug("*** " + img_url + " ***")
self.log.debug("********** img size = " + str(img_size) + " **********")
elem.set("style","width:100%")
changed_text = True
break
if changed_text == True:
html_text = etree.tostring(html)
return html_text
我知道这里必须有一些简单的错误 - 我只是看不到它:)
答案 0 :(得分:4)
int
始终小于str
。首先将标头值转换为int
。请记住,使用repr()
进行调试,而不是str()
。
答案 1 :(得分:0)
img_size是一个不是int的字符串:
>>> 30720 < '0'
True