是否有更好的方法来获取大于20,000的表数据?

时间:2019-01-28 05:25:29

标签: python-3.x selenium

我最近正尝试使用selenium(Chrome驱动程序一个)在网络上获取一些数据。通常情况下,该表格最多可以显示30个页面,但是我更改了它的参数,因此现在最多可以显示30,000个页面。

问题是,当我使用代码来获取数据时,它花费的时间太长。 我将其分为多页,每页2000个数据,但仍然花费了太长时间。

这是我用来获取数据的代码

大约花了3个小时? 5?我试图获取1000条数据的分钟。

'self'

我只想检查是否有人对此有更好的主意。

谢谢您的提前建议! 谢谢!

1 个答案:

答案 0 :(得分:2)

您可以使用JavaScript更快地获取数据,请尝试以下代码:

texts = driver.execute_script('return [...document.querySelectorAll("div.datagrid_class table.table1 tbody tr td")].map(e=>e.textContent)')

您还可以找到更多示例herehere