应用错误收集

如何从此网页中提取链接（使用R）？

时间：2018-01-09 19:28:21

标签： r rvest rselenium

使用R，我正在尝试获取以下网页上显示的链接：https://icerbox.com/folder/eVDOgpD1/Goldmine.320

该页面包含135个文件链接。将鼠标悬停在文件名上时，右侧会显示蓝色下载符号。此下载符号指向文件的实际URL。但是，该URL似乎是由javascript生成的，并且不存在于html文件本身中。

我想提取这些网址，但我不知道如何捕获这些动态生成的网址。

任何人都可以帮我解决这些问题吗？我对R（rvest，RSelenium等）中的任何方法持开放态度

1 个答案:

答案 0 :(得分：2)

看起来你对http://example.com的需求与PhantomJS非常相似，他们也希望抓住javascript中的链接