标签: javascript python beautifulsoup urllib2
我刚刚在Python 2.7.2中使用BeautifulSoup开始屏幕抓取,我想从这个网站上获取数据:
http://www.trainsimple.com/SelfPaced.aspx
但是,如果我使用.prettify()函数,使用urllib2打开此URL并使用LXML解析它会产生大量垃圾。
查看页面源后,我看到页面实际上是使用javascript呈现的,并且div是动态加载的。
有没有人知道如何从这个网站获取数据?
谢谢