以下代码在昨天工作,现在它在终端中挂起,给出了错误list index out of range
,但是当我使用IDE运行相同的代码时,它运行得很好。
我不明白发生了什么。并且没有网址无效。
import requests
import bs4
import webbrowser
import csv
def CheckStock(url):
'''checks for shoes in stock'''
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
RawHTML = requests.get(url, headers=headers)
Page = bs4.BeautifulSoup(RawHTML.text, "lxml")
ListOfRawSizes = Page.select('.size-dropdown-block')
Sizes = str(ListOfRawSizes[0].getText()).replace('\t', '')
Sizes = Sizes.replace('\n\n', ' ')
Sizes = Sizes.split()
Sizes.remove('Select')
Sizes.remove('size')
return Sizes
答案 0 :(得分:1)
问题是,如果您的网页不包含任何.size-dropdown-block
类的元素,那么您的ListOfRawSizes[0]
索引将超出范围。如果列表为空,则无法请求列表中的第一项,这将导致index out of range
错误。这很可能是因为页面与前一天不同,现在是您尝试的。
在尝试索引列表之前,您需要检查ListOfRawSizes
是否包含任何项目。幸运的是,python可以很容易地检查列表是否为空,如果列表至少有一个项目,if ListOfRawSizes:
将为真。
ListOfRawSizes = Page.select('.size-dropdown-block')
# check to see if the list of raw sizes is not empty
if ListOfRawSizes:
# we have at least one size so get the first item and do our work
Sizes = str(ListOfRawSizes[0].getText()).replace('\t', '')
Sizes = Sizes.replace('\n\n', ' ')
Sizes = Sizes.split()
Sizes.remove('Select')
Sizes.remove('size')
return Sizes
# if we hit the else clause, our list must be empty
else:
# ...so return an empty list
return []
此外,你真的不应该用大写字母命名你的变量。这很容易与类名冲突。 Python中的变量遵循“蛇案”惯例;全部小写,带下划线以分隔单词。 (例如:this_is_snake_case
)。