使用Python搜索雅虎财经的头条新闻

时间:2014-03-11 16:14:59

标签: python web-scraping beautifulsoup yahoo-finance

我正在使用美丽的汤来从这个页面中提取标题http://in.finance.yahoo.com/q?s=AAPL但我需要过去3个月的头条新闻,即从2013年12月10日到2014年3月10日。但我只能提取他们的头条新闻这个特定的页面。如何为任何特定公司提取所需的标题?

代码:

url = 'http://in.finance.yahoo.com/q?s=AAPL'
data = urllib2.urlopen(url)
soup = BeautifulSoup(data)

divs = soup.find('div',attrs={'id':'yfi_headlines'})
div = divs.find('div',attrs={'class':'bd'})
ul = div.find('ul')
lis = ul.findAll('li')
hls = []
for li in lis:
    headlines = li.find('a').contents[0]
    print headlines

2 个答案:

答案 0 :(得分:0)

我认为您的问题与您从中获取数据的位置更相关,如果您需要过去三个月的数据,则应该查询http://in.finance.yahoo.com/q/hp?s=AAPL,其中您查找的所有数据都显示在表格中。

答案 1 :(得分:0)

http://in.finance.yahoo.com/q?s=AAPL上,点击AAPL'的更多标题。从那里你将获得一个包含日期时间字段的链接。修改它,你应该是好的。 (http://in.finance.yahoo.com/q/h?s=AAPL&t=2014-02-08T15:06:40+05:30