我正在尝试使用Python 2.7从Yahoo Finance读取表格数据,并让它为我提供所有数据的二维列表。到目前为止,这是我的代码:
def getStocks():
from lxml import html
import requests
page = requests.get("https://finance.yahoo.com/q/op?s=INTC+Options")
tree = html.fromstring(page.text)
output = [["Strike"]["Contract Name"]["Last"]["Bid"]["Ask"]["Change"]["\% Change"]["Volume"]["Open Interest"]["Implied Volatility"]]
for x in range(10):
colData = tree.xpath('//tr[@data-row-quote="_"]/td[{}]//*[text()]/text()'.format(x + 1))
output[x].extend(colData)
现在当我运行它时,它给了我这个错误:
Traceback (most recent call last):
File "C:\Users\username\Python\stock_get.py", line 17, in <module>
getStocks()
File "C:\Users\username\Python\stock_get.py", line 8, in getStocks
output = [["Strike"]["Contract Name"]["Last"]["Bid"]["Ask"]["Change"]["\% Change"]["Volume"]["Open Interest"]["Implied Volatility"]]
TypeError: list indices must be integers, not str
我看了其他答案,但我不确定他们的意思。
有没有更好的方法以一种清晰易读的方式返回所有表格数据?
如果没有,我该如何解决这个错误?我希望它能给我这样的东西:
[["Strike", "28.00", "30.00", "30.50"...], ["Contract Name", "INTC150206C00028000"...], and_so_on]
答案 0 :(得分:2)
您没有在此处定义列表列表:
output = [["Strike"]["Contract Name"]["Last"]["Bid"]["Ask"]["Change"]["\% Change"]["Volume"]["Open Interest"]["Implied Volatility"]]
您正在尝试索引第一个列表["Strike"][...]
,因此Python看到第一部分是一个列表,并期望第二部分传入一个整数,但找到一个字符串代替。
您似乎忘记添加逗号:
output = [["Strike"], ["Contract Name"], ["Last"], ["Bid"], ["Ask"],
["Change"], ["\% Change"], ["Volume"], ["Open Interest"],
["Implied Volatility"]]