为什么urllib库不打印收集的数据?

时间:2015-06-02 23:50:26

标签: python web-scraping urllib

3

试图从雅虎财经中提取股票数据。语法是正确的,它只打印空白方括号而不是其中的库存数据。如果有人知道问题是什么,我真的很感激一些帮助。

1 个答案:

答案 0 :(得分:1)

范围ID为l84,而不是184,修复该问题并且有效。此外,您可能想要删除URL中的空格,并在正则表达式模式周围放置单引号

regex = '<span id="yfs_l84_%s">(.+?)</span>' % symbol.lower()

编辑:您也可以从CSV中获取雅虎的价格(以及更多),并传输更少的数据,例如AAPL:

http://download.finance.yahoo.com/d/quotes.csv?s=aapl&f=snl1d1t1c1w

f是格式,并且有blog post列出了一些值,但我似乎找不到雅虎的引用。