使用R和RVest进行Web抓取以从表中提取数据

时间:2019-03-25 09:17:55

标签: r web-scraping rvest

我对如何取消下面的网站以提取第二个数据表“地区最新交易”有疑问

https://data.28hse.com/en/#

我当前拥有的代码是这样:

url <- "https://data.28hse.com/en/#"
pgsession <- html_session(url)
hk <- read_html(url)
hk_data <- html_table(html_nodes(hk,"table")[[12]], fill = TRUE)
hk_data

#12表是正确的节点,但似乎未返回任何值。不知道我在做什么错。在#9上运行时,它会正确返回第一个表“ Popular Estates”,但对于#12而言,这是不起作用的。 我对HTML / CSS的了解有限。

我的目标是循环浏览第二张桌子,大约击中“下一个”按钮约50次,并废弃至少一年的记录。

非常感谢任何帮助。

谢谢 狂暴者

0 个答案:

没有答案