使用Pythons BeautifulSoup刮取动态加载的javascript有盖网站

时间:2013-08-03 15:18:57

标签: javascript python beautifulsoup urllib2

我刚刚在Python 2.7.2中使用BeautifulSoup开始屏幕抓取,我想从这个网站上获取数据:

http://www.trainsimple.com/SelfPaced.aspx

但是,如果我使用.prettify()函数,使用urllib2打开此URL并使用LXML解析它会产生大量垃圾。

查看页面源后,我看到页面实际上是使用javascript呈现的,并且div是动态加载的。

有没有人知道如何从这个网站获取数据?

谢谢

0 个答案:

没有答案