使用Python刮取基于Javascript的网站

时间:2015-02-28 23:33:57

标签: python python-2.7 web-scraping

我试图从这里废弃数据(使用python 2.7):

http://financials.morningstar.com/valuation/earnings-estimates.html?t=AMD

当我右键单击并在Chrome浏览器中选择“查看页面来源”时,我正在寻找的内容不存在。例如,我正在寻找“平均评级”。

我搜索了Stackoverflow并看到了这个问题和答案: Python 3, Web-scraping, and Javascript [Oh My] 但是当我尝试主要答案时,我找不到任何XMLHttpRequest函数。

我很感激你的帮助。

1 个答案:

答案 0 :(得分:1)

看起来您想要的数据来自

http://financials.morningstar.com/valuation/annual-estimate-list.action?&t=XNAS:AMD&region=usa&culture=en-US&cur=&r=1425167484279.9668&_=1425167484280
http://financials.morningstar.com/valuation/analyst-opinion-list.action?&t=XNAS:AMD&region=usa&culture=en-US&cur=&r=1425167484282.3906&_=1425167484282
http://financials.morningstar.com/valuation/forward-comparisons-list.action?&t=XNAS:AMD&region=usa&culture=en-US&cur=&r=1425167484284.5396&_=1425167484284

你应该能够直接刮掉这些网址。