应用错误收集

如何刮取由Javascript动态生成的表

时间：2018-06-04 13:53:00

标签： r web web-scraping rvest httr

我是R的初学者，并试图从不同的网站提取不同的表格数据。我能够执行基本的数据抓取，但是在尝试从下表中提取数据时我陷入困境。

url：https://www.nseindia.com/live_market/dynaContent/live_watch/equities_stock_watch.htm?cat=N

我尝试使用l.remove()＆amp; html_read函数使用css和xpath，但它不返回值。谁能告诉我如何继续？

1 个答案:

答案 0 :(得分：2)

所以你面临的问题是rvest会读取页面的来源，但它不会在页面上执行javascript。该表是通过在加载源后执行javascript 创建的。

您最好的选择是研究RSelenium。这是因为RSelenium实际启动并驱动浏览器窗口，一旦执行了javascript，您就可以查询当前的来源（如果您在Chrome中右键单击并选择Inspect，您会看到什么）。

但是，RSelenium是从CRAN中提取的，因为某些依赖项是从CRAN中提取的，因此您可能需要使用MRAN来安装它。

相关问题

抓取由Javascript生成的网站

如何使用python抓取javascript生成的数据

如何在本网站中抓取动态生成的数据？

如何使用由Javascript函数生成的Ruby来抓取数据？

编辑动态生成的表

如何选择动态生成的特定li元素

从js生成的表中抓取内容

是否无法获得动态生成的点击表？

由脚本生成的scrape表

如何刮取由Javascript动态生成的表

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？