在Python中排序表数据时的TypeError

时间:2015-02-06 16:44:19

标签: python html python-2.7 xpath typeerror

我正在尝试使用Python 2.7从Yahoo Finance读取表格数据,并让它为我提供所有数据的二维列表。到目前为止,这是我的代码:

def getStocks():
    from lxml import html
    import requests

    page = requests.get("https://finance.yahoo.com/q/op?s=INTC+Options")
    tree = html.fromstring(page.text)

    output = [["Strike"]["Contract Name"]["Last"]["Bid"]["Ask"]["Change"]["\% Change"]["Volume"]["Open Interest"]["Implied Volatility"]]
    for x in range(10):
        colData = tree.xpath('//tr[@data-row-quote="_"]/td[{}]//*[text()]/text()'.format(x + 1))
        output[x].extend(colData)

现在当我运行它时,它给了我这个错误:

Traceback (most recent call last):
  File "C:\Users\username\Python\stock_get.py", line 17, in <module>
    getStocks()
  File "C:\Users\username\Python\stock_get.py", line 8, in getStocks
    output = [["Strike"]["Contract Name"]["Last"]["Bid"]["Ask"]["Change"]["\% Change"]["Volume"]["Open Interest"]["Implied Volatility"]]
TypeError: list indices must be integers, not str

我看了其他答案,但我不确定他们的意思。

有没有更好的方法以一种清晰易读的方式返回所有表格数据?

如果没有,我该如何解决这个错误?我希望它能给我这样的东西:

[["Strike", "28.00", "30.00", "30.50"...], ["Contract Name", "INTC150206C00028000"...], and_so_on]

1 个答案:

答案 0 :(得分:2)

您没有在此处定义列表列表:

output = [["Strike"]["Contract Name"]["Last"]["Bid"]["Ask"]["Change"]["\% Change"]["Volume"]["Open Interest"]["Implied Volatility"]]

您正在尝试索引第一个列表["Strike"][...],因此Python看到第一部分是一个列表,并期望第二部分传入一个整数,但找到一个字符串代替。

您似乎忘记添加逗号:

output = [["Strike"], ["Contract Name"], ["Last"], ["Bid"], ["Ask"],
          ["Change"], ["\% Change"], ["Volume"], ["Open Interest"], 
          ["Implied Volatility"]]