如何使用R从网站提取表格数据

时间:2019-01-28 10:45:04

标签: r web-scraping data-extraction

我正在尝试从网页中提取数据 https://www.geojit.com/other-market/world-indices 还有许多与此类似的东西。

我需要获取网站的表格数据(INDEX,NAME,COUNTRY,CLOSE,PREV.CLOSE,NET CHANGE,CHANGE(%),最后更新日期和时间)。如果您可以为此共享R代码,那将是很棒的,否则任何帮助都将受到欢迎。

library(rvest)
library(dplyr)   
google <- html("https://www.geojit.com/other-market/world-indices")    
google %>%    
html_nodes()

1 个答案:

答案 0 :(得分:2)

library(rvest)
my_tbl <- read_html("https://www.geojit.com/other-market/world-indices") %>%    
  html_nodes(xpath = "//*[@id=\"aboutContent\"]/div[2]/table") %>%
  html_table(header = TRUE) %>%
  `[[`(1)