Python Web Scraping - 动态数据表

时间:2016-09-16 14:06:52

标签: python selenium

我想从动态更改表中删除数据。

首次打开网站时,该表为空,但每隔1-2秒会以新值更新。

我尝试使用requests和lxml python包(Hitchiker的Python指南),但我只得到空表。

然后我用Selenium做了,但是总是启动一个新的浏览器有点太慢了(我需要每20-30秒获得一次)。

该表使用名为Lightstreamer的消息传递服务。

1 个答案:

答案 0 :(得分:0)

为什么不使用类似于PhantomJS的内容,而不是每次都启动新的浏览器。使用Selenium可以加快代码速度。或者使用Scrappy而不是Selenium尝试Splash。在一天结束时,如果没有看到你做过或尝试过的事情,很难帮助你。此外,还有很多关于如何在本网站或谷歌上使用它们的指南。