使用Rvest从Aria表栏中刮取

时间:2016-10-25 11:33:23

标签: r screen-scraping rvest

小问题,我不认为这是基于谷歌搜索的复制品。

我正试图从一组表格中删除数据,例如“NAME”http://www.votewatch.eu/en/term8-thailand-notably-the-case-of-andy-hall-joint-motion-for-resolution-paragraph-11-amendment-1.html

我正在尝试使用

library(rvest)
library(magrittr)
url <- "http://www.votewatch.eu/en/term8-thailand-notably-the-case-of-andy-hall-joint-motion-for-resolution-paragraph-11-amendment-1.html"
read <- read_html(url)
nodes <- read %>% html_nodes("td.sorting_1 > a") #based on copy/paste CSS selector

但是得到一个长度为0的节点,我无法从中提取任何东西。我也尝试使用选择器小工具,但仍然无法从表中获得任何东西。

有什么想法?感谢,

1 个答案:

答案 0 :(得分:0)

这是因为页面需要登录...

enter image description here

你需要首先进行身份验证......看看Rselenium这将更难以刮掉。