如何从此网页中提取链接(使用R)?

时间:2018-01-09 19:28:21

标签: r rvest rselenium

使用R,我正在尝试获取以下网页上显示的链接:https://icerbox.com/folder/eVDOgpD1/Goldmine.320

该页面包含135个文件链接。将鼠标悬停在文件名上时,右侧会显示蓝色下载符号。此下载符号指向文件的实际URL。但是,该URL似乎是由javascript生成的,并且不存在于html文件本身中。

我想提取这些网址,但我不知道如何捕获这些动态生成的网址。

任何人都可以帮我解决这些问题吗?我对R(rvest,RSelenium等)中的任何方法持开放态度

1 个答案:

答案 0 :(得分:2)

看起来你对http://example.com的需求与PhantomJS非常相似,他们也希望抓住javascript中的链接