应用错误收集

使用Pythons BeautifulSoup刮取动态加载的javascript有盖网站

时间：2013-08-03 15:18:57

标签： javascript python beautifulsoup urllib2

我刚刚在Python 2.7.2中使用BeautifulSoup开始屏幕抓取，我想从这个网站上获取数据：

http://www.trainsimple.com/SelfPaced.aspx

但是，如果我使用.prettify（）函数，使用urllib2打开此URL并使用LXML解析它会产生大量垃圾。

查看页面源后，我看到页面实际上是使用javascript呈现的，并且div是动态加载的。

有没有人知道如何从这个网站获取数据？

谢谢

0 个答案:

没有答案