Requests.get()遇到问题

时间:2017-06-05 01:36:01

标签: python list request python-requests

以下代码在昨天工作,现在它在终端中挂起,给出了错误list index out of range,但是当我使用IDE运行相同的代码时,它运行得很好。

我不明白发生了什么。并且没有网址无效。

import requests  
import bs4  
import webbrowser       
import csv


def CheckStock(url):  
'''checks for shoes in stock'''  
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}  
    RawHTML = requests.get(url, headers=headers)  
    Page = bs4.BeautifulSoup(RawHTML.text, "lxml")  
    ListOfRawSizes = Page.select('.size-dropdown-block')  
    Sizes = str(ListOfRawSizes[0].getText()).replace('\t', '')  
    Sizes = Sizes.replace('\n\n', ' ')  
    Sizes = Sizes.split()  
    Sizes.remove('Select')  
    Sizes.remove('size')  
    return Sizes    

1 个答案:

答案 0 :(得分:1)

问题是,如果您的网页不包含任何.size-dropdown-block类的元素,那么您的ListOfRawSizes[0]索引将超出范围。如果列表为空,则无法请求列表中的第一项,这将导致index out of range错误。这很可能是因为页面与前一天不同,现在是您尝试的。

在尝试索引列表之前,您需要检查ListOfRawSizes是否包含任何项目。幸运的是,python可以很容易地检查列表是否为空,如果列表至少有一个项目,if ListOfRawSizes:将为真。

ListOfRawSizes = Page.select('.size-dropdown-block')

# check to see if the list of raw sizes is not empty
if ListOfRawSizes:
    # we have at least one size so get the first item and do our work
    Sizes = str(ListOfRawSizes[0].getText()).replace('\t', '')  
    Sizes = Sizes.replace('\n\n', ' ')  
    Sizes = Sizes.split()  
    Sizes.remove('Select')  
    Sizes.remove('size')  
    return Sizes
# if we hit the else clause, our list must be empty
else:
    # ...so return an empty list
    return []

此外,你真的不应该用大写字母命名你的变量。这很容易与类名冲突。 Python中的变量遵循“蛇案”惯例;全部小写,带下划线以分隔单词。 (例如:this_is_snake_case)。